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Transcodage entre indices de dictionnafres multi-impulsionnels utilises 

en codaqe en compression de sjgnaux numeriaues 

La presente invention concerne le codage/decodage de signaux numeriques, 
s notamment dans des applications de transmission ou de stockage des signaux 
multimedias tels que les signaux audio (parole et/ou sons). 

Dans le domaine du codage en compression, de nombreux codeurs 
modelisent un signal de L echantillons par des impulsions en nombre restreint, 

10 tres inferieur au nombre total d'echantillons. C'est, par exemple, le cas de 
certains codeurs audio frequentiels tels que le codeur audio dit "TDAC" decrit 
notamment dans le document publie US-2001/027393. Dans ce codeur, les 
coefficients de transformee en cosinus discrete modifiee normalises dans 
chaque bande sont quantifies par des quantificateurs vectoriels utilisant des 

is dictionnaires algebriques imbriques en taille, ces codes algebriques 
comportent en general quelques composantes non nulles, les autres 
composantes etant egales a zero. C'est aussi le cas de la majorite des 
codeurs de parole a analyse par synthese notamment de type "ACELP' (pour 
"Algebraic Code Excited Linear Prediction"), de type MP-MLQ (pour 

20 "MultiPulse Maximum Likelihood Quantization"), ou autres. En effet, pour 
modeliser le signal d'innovation, ces codeurs utilisent un repertoire, compose 
de formes d'ondes ayant tres peu de composantes non nulles dont les 
positions et les amplitudes obeissent, de plus, a des regies predeterminees. 

* 

25 On decrit brievement ci-apres de tels codeurs a analyse par synthese. 

_Dans_ces codeurs a analyse par synthese, le modele de synthese est utilise 
au codage pour extraire les parametres modelisant les signaux a coder. Ces 
signaux peuvent §tre echantillonnes a la frequence telephonique (F e = 8 kHz) 
30 ou a une frequence plus elevee, par exemple a 16 kHz pour le codage en 
bande elargie (bande passante de 50 Hz a 7 kHz). Selon I'application et la 
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quality desiree, le taux de compression varie de 1 a 16. Ces codeurs 
fonctionnent a des debits de 2 a 16 kbit/s en bande telephonique, et a des 
debits de 6 a 32 kbit/s en bande elargie. 

Le principe d'un dispositif de codage/decodage numerique de type CELP, qui 
est le codeur/decodeur a analyse par synthese le plus utilise actuellement 
pour le codage/decodage des signaux de parole, est brievement decrit ci- 
apres. Le signal de parole est echantillonne et converti en une suite de blocs 
de L' echantillons appeles trames. En general, chaque trame est decoupee en 
blocs plus petits de L echantillons, appeles sous-trames. Chaque bloc est 
synthetise en filtrant une forme d'onde extraite d'un repertoire (appele aussi 
dictionnaire), multipliee par un gain, a travers deux filtres variant dans le 
temps. Le dictionnaire d'excitation est un ensemble fini de formes d'ondes de L 
echantillons. Le premier filtre est le filtre de prediction a long terme. Une 
analyse dite "Z.7P* (pour "Long Term Prediction") permet d'evaluer les 
parametres de ce filtre de prediction a long terme qui exploite la periodicite des 
sons voises (representant typiquement la frequence du fondamental 
(frequence de vibration des cordes vocales)). Le second filtre est le filtre de 
prediction a court terme. Les methodes d'analyse "LPC (pour "Linear 
Prediction Coding") permettent d'obtenir ces parametres de prediction a court 
terme, representatifs de la fonction de transfert du conduit vocal et 
caracteristiques du spectre du signal (representant typiquement les 
modulations dues a la forme prise par les levres, a la position de la langue et 
du larynx, ou autres). 

Le procede utilise pour determiner la sequence d'innovation est la methode 
d'analyse par synthese. Au niveau du codeur, un grand nombre de sequences 
d'innovation du dictionnaire d'excitation sont filtrees par les deux filtres LTP et 
LPC, et la forme d'onde selectionnee est celle produisant le signal synthetique 
le plus proche du signal original selon un critere de ponderation perceptuelle, 
connu en general sous le nom de critere CELP. 
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On decrit brievement ci-apres 1'utilisation de dictionnaires multi-impulsionnels 
dans de tels codeurs a analyse par synthese, etant bien entendu toutefois que 
les codeurs CELP, comme les decodeurs CELP, sont bien connus de Phomme 
de Tart. 

Le codeur multkiebits de la norme UIT-T G.723.1 est un bon exemple de 
codeur a analyse par synthese utilisant des dictionnaires multi-impulsionnels. 
Ici, les positions d'impulsions sont toutes distinctes. Les deux debits du codeur 
(6,3 kbit/s et 5,3 kbit/s) modelisent le signal d'innovation par des formes d'onde 
extraites de dictionnaires qui ne comportent qu'un nombre restreint 
d'impulsions non nulles: 6 ou 5 pour le haut debit, 4 pour le bas debit. Ces 
impulsions sont d'amplitude +1 ou -1. Dans son mode a 6,3 kbit/s, le codeur 
G.723.1 utilise alternativement deux dictionnaires : 

- dans le premier utilise pour les sous-trames paires, les formes d'ondes 
comportent 6 impulsions et, 

- dans le deuxieme utilise pour les sous-trames impaires, elles 
comportent 5 impulsions. 

Pour ces deux dictionnaires, une seule restriction est impos6e aux positions 
des impulsions de tout vecteur-code. Ces positions doivent toutes avoir la 
meme parite, c'est-a-dire qu'elles sont toutes paires ou toutes impaires. Dans 
le dictionnaire du mode a 5,3 kbit/s, les positions des 4 impulsions sont plus 
contraintes. Outre la meme contrainte de parite que les dictionnaires du mode 
haut debit, chaque impulsion a un choix limite de positions. 

Le dictionnaire multi-impulsionnel du mode a 5,3 kbit/s appartient a la famille 
bien connue des dictionnaires ACELP. La structure d'un repertoire ACELP est 
basee sur la technique ISPP (pour "Interleaved Single-Pulse Permutation") qui 
consiste a diviser I'ensemble des L positions en K pistes entrelacees, chacune 
des N impulsions etant localisee dans certaines pistes predefinies. Dans 
certaines applications, la dimension L des mots de codes peut etre etendue a 



WO 2005/066936 



PCT/FR2004/003008 



4 

Z.+N. Ainsi dans le cas du repertoire du mode bas debit du codeur selon la 
norme UIT-T G.723.1, la dimension du bloc de 60 echantillons a et6 etendue 3 
64 echantillons et les 32 positions paires (respectivement impaires) ont 6t6 
divis6es en 4 pistes entrelacees de longueur 8 ne se recouvrant pas, II y a 
done deux groupes de 4 pistes, un pour chaque parity. La table 1 ci-aprds 
pr§sente pour chaque impulsion notee i 0 a Tensemble de ces 4 pistes pour 
les positions paires. ~ " 



Impulsion 


Signe 


Positions 




±1 


0,8,16,24,32,40,48,56 


• 


±1 


2, 10, 18, 26,34,42, 50,58 


h 


±1 


4, 12, 20, 28, 36, 44, 52, (60) 


h 


±1 


6, 14, 22, 30, 38, 46, 54, (62) 



Table 1: Positions et amplitudes des impulsions du dictionnaire ACELP du codeur 

G.723.1 a 5,3 kbit/s 

Les dictionnaires d'innovation ACELP sont utilises dans de nombreux codeurs 
a analyse par synthese qui sont normalises (UIT-T G.723.1, UIT-T G.729, IS- 
641, 3GPP NB-AMR, 3GPP WB-AMR). Les tables 2 a 4 ci-apres presentent 
quelques exemples de ces dictionnaires ACELP pour une longueur de bloc de 
40 echantillons. On notera que la contrainte de parite n'est pas utilisee dans 
ces dictionnaires. La table 2 presente le dictionnaire ACELP a 17 bits et 4 
impulsions non nulles d'amplitude ±1, utilise dans le codeur UIT-T G.729 a 8 
bkit/s, dans le codeur IS-641 a 7,4 kbit/s ainsi que dans les modes 7,4 et 7,95 
kbit/s du codeur 3GPP NB-AMR. 



Impulsion 


Signe 


Positions 


f 0 


±1 


0, 5, 10, 15, 20, 25, 30, 35 


• 


±1 


1,6, 11,16,21,26,31,36 




±1 


2, 7, 12, 17, 22, 27, 32, 37 


h 


±1 


3. 8, 13, 18, 23, 28, 33, 38 

4.9, 14, 19,24,29,34,39 



Table 2: Positions et amplitudes des impulsions du dictionnaire ACELP des codeurs 
UIT-T G. 729 d 8 kbit/s, IS641 a 7,4 kbit/s et 3 GPP NB-AMR a 7,4 et 7,95 kbit/s 
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Dans le dictionnaire ACELP a 35 bits utilise dans le mode 12,2 kbit/s du 
codeur 3GGPP NB-AMR, chaque vecteur-code contient 10 impulsions non 
nulles d'amplitude ±1. Le bloc de 40 6chantillons est divis6 en 5 pistes de 
longueur 8, chacune contenant 2 impulsions. On note que les deux impulsions 
d'une meme piste peuvent se recouvrir et resulter en une seule impulsion 
d'amplitiide ±2. Ce dictionnaire est pr6sente a la table 3. 



Impulsion 


Signe 


Positions 




±1 


0, 5, 10, 15, 20, 25, 30, 35 




±1 


1,6,11,16,21,26,31,36 




±1 


2, 7, 12, 17, 22, 27, 32, 37 


h, h 


±1 


3,8,13, 18,23,28,33, 38 


U, i 9 


±1 


4, 9, 14, 19, 24, 29, 34, 39 



10 



3GPP NB-AMR d 12,2 kbit/s 



Enfin, la table 4 presente le dictionnaire ACELP a 1 1 bits et 2 impulsions non 
nulles d'amplitude ±1, utilise dans I'extension a bas debit (6,4 bkit/s) du codeur 
UIT-T G.729 et dans le mode 5,9 kbit/s du codeur 3GPP NB-AMR. 



15 



Xmpulsion 


Signe 


Positions 




±1 


1, 3, 6, 8, 11, 13, 16, 18, 21, 23, 26, 28, 31, 33, 36, 38 


• 


±1 


0, 1, 2, 4, 5, 6, 7, 9, 10, 11, 12, 14, 15, 16, 17, 19, 20, 21, 22, 24, 25, 
26, 27, 29, 30, 31, 32, 34, 35, 36, 37, 39 



UIT-T G. 729 d6,4 kbit/s et 3GPP NB-AMR d5,9 kbit/s 



On decrit ci-apres ce que Ton entend par "/'exploration" des dictionnaires multi- 
impulsionnels. 



20 
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Comme pour toute operation de quantification, la recherche de la moderation 
optimale d'un vecteur a coder consiste a choisir dans I'ensemble (ou dans un 
sous-ensemble) des vecteurs-codes du dictionnaire, celui qui lui "ressemble" 
le plus, c'est-a-dire celui qui minimise une mesure de distance entre lui et ce 
vecteur d'entree. Pour ce faire, on procede a une etape dite "d'exploration" des 
dictionnaires. 

Dans le cas des dictionnaires multi-impulsionnels, cette etape revient a 
rechercher la combinaison d'impulsions qui optimise la proximite entre le 
signal a modeliser et le signal resultant du choix des impulsions. Selon la tailie 
et/ou la structure du dictionnaire, cette exploration peut etre exhaustive ou non 
(done plus ou moins complexe). 

Les dictionnaires utilises dans le codeur TDAC precite etant des unions de 
codes a permutation de type II, I'algorithme de codage d'un vecteur de 
coefficients de transformee normalises exploite cette propriete pour determiner 
son plus proche voisin parmi tous les vecteurs-codes tout en ne calculant 
qu'un nombre limite de criteres de distance (avec une utilisation de vecteurs 
dits "leaders absolus"). 

Dans les codeurs a analyse par synthese, I'exploration des dictionnaires multi- 
impulsionnels n'est pas exhaustive sauf pour les dictionnaires de faible tailie. 
Pour les dictionnaires a plus haut debit, seul un petit pourcentage du 
dictionnaire est explore. Par exemple, I'exploration des dictionnaires multi- 
impulsionnels de type ACELP est generalement effectuee en deux etapes. 
Pour simplifier cette recherche, une premiere etape preselectionne pour 
chaque position possible d'impulsion son amplitude (done son signe comme 
indique ci-avant) par une simple quantification d'un signal dependant du signal 
d'entree. Les amplitudes des impulsions etant fixees, les positions des 
impulsions sont alors recherchees par une technique d'analyse par synthese 
(selon le critere CELP). En depit de I'exploitation de la structure en ISPP et du 
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nombre restreint d'irnpulsions, une recherche exhaustive des combinaisons 
des positions rVest effective que pour les dictionnaires bas debit (typiquement 
inferieur ou 6gal a 12 bits). C'est le cas par exemple, pour le dictionnaire 
ACELP £ 11 bits (table 4) utilise dans le codeur G.729 £ 6,4 kbit/s oCi les 512 
5 combinaisons de positions de 2 impulsions sont toutes testes pour 
s6lectionner la meilleure, ce qui revient a calculer les 512 criteres CELP 
correspondants. ■ — 

Pour les dictionnaires & plus haut d6bit, diverses methodes dites de 
10 focalisation ont ete proposees. On parle alors de "recherche focalisGe". 

Certaines de ces methodes, connues, sont utilis6es dans les codeurs 
normalises cites ci-avant. Leur but est de reduire le nombre de combinaisons 
de positions a explorer en se basant sur les proprietes du signal a mod§liser. 

15 Par exemple, on peut citer I'algorithme dit "depth-first tree", utilise par 
beaucoup de codeurs ACELP standardises. Dans cet algorithme, on privilSgie 
certaines positions telles que les maxima locaux des pistes d'un signal-cible 
dependant du signal d'entree, du signal synthetique pass6 et du filtre compose 
des filtres de synthese et de pond§ration perceptuelle. II en existe plusieurs 

20 variantes selon la taille du dictionnaire utilise. Pour explorer le dictionnaire 
ACELP a 35 bits et 10 impulsions (table 3), la premiere impulsion est plac6e a 
la meme position que le maximum global du signal-cible. Puis, quatre 
iterations sont effectuees par permutation circulaire des pistes consecutives. A 
chaque iteration, la position de la deuxfeme impulsion est fixee au maximum 

25 local d'une des 4 autres pistes, les positions des huit autres impulsions 
restantes sont recherchees sequentiellement par paires dans des boucles 
imbriquees. On teste a chaque iteration 256 (=4 pairesx8x8) combinaisons 
differentes, ce qui permet done de n'explorer que 1024 combinaisons de 
positions des 10 impulsions parmi les 2 25 du dictionnaire. Une autre variante 

30 est utilisee dans le codeur IS641 oCi un pourcentage plus eleve de 
combinaisons du dictionnaire a 17 bits et 4 impulsions (table 2) est explore. On 
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teste 768 combinaisons parmi les 8192 (=2 13 ) combinaisons de positions 
d'impulsions. Dans le codeur G.729 a 8 kbit/s, ce meme dictionnaire ACELP 
est explore par une methode differente de focalisation. L'algorithme effectue 
une recherche iterative en imbriquant quatre boucles de recherche des 
impulsions (une par impulsion). La recherche est focalisee en rendant I'entree 
dans la boucle interieure (recherche de la dernlere impulsion appartenant aux 
pistes 3 ou 4) conditionnelle au depassement d'un seuil adaptatif: Ce seuir 
depend aussi des proprietes du signal-cible (maxima locaux et moyennes des 
3 premieres pistes). De plus, le nombre maximal d'explorations de 
combinaisons de 4 impulsions est fixe a 1440 (soit 17,6 % des 8192 
combinaisons). 

Dans le codeur G.723.1 a 6,3 kbit/s, toutes les 2x2 5 xc£, (respectivement 
2x2 6 xC 3 6 0 ) combinaisons de 5 (respectivement 6) impulsions ne sont pas 
explorees. Pour chaque grille, I'algorithme emploie une analyse connue, de 
type "multipulse", pour rechercher sequentiellement les positions et les 
amplitudes des impulsions. Comme pour les dictionnaires ACELP, des 
variantes existent pour restreindre le nombre de combinaisons testees. 

De telles techniques presentent toutefois les problemes ci-apres. 

L'exploration, meme sous-optimale, d'un dictionnaire multi-impulsionnel 
constitue dans beaucoup de codeurs une operation coQteuse en temps de 
calcul. Par exemple, dans les codeurs G.723.1 a 6,3kbit/s et le G.729 a 8 
kbit/s, cette recherche represente pres de la moitie de la complexite totale du 
codeur. Pour le NB-AMR, elle represente le tiers de la complexite totale du 
codeur. Pour le codeur TDAC, elle represente le quart de la complexite totale 
du codeur. 
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On comprendra en particulier que cette complexity devient critique lorsque 
plusieurs codages doivent etre effectues par une mSme unite de traitement, 
telle qu'une passerelle chargee de gerer de nombreuses communications en 
parallele ou un serveur distribuant de nombreux contenus multimedias. Le 
probldme de la complexity est encore accru par la multiplicity des formats de 
compression qui circulent sur les reseaux. 

En effet, pour offrir mobility et continuity, les services de communication 
multimedias modernes et innovants doivent pouvoir fonctionner dans une 
grande variety de conditions. Le dynamisme du secteur de la communication 
multimydia et I'hytyrogenyity des reseaux, acces et terminaux ont engendre 
une prolifyration de formats de compression dont la presence dans les 
chames de communication nycessite plusieurs codages soit en cascade 
(transcodage), soit en parallele (codage multi-format ou codage multi-mode). 

On dyfinit ci-apres ce que Ton entend par "transcodage". Le transcodage 
devient nycessaire lorsque, dans une chame de transmission, une trame de 
signal compressee ymise par un codeur ne peut plus poursuivre son chemin, 
sous ce format. Le transcodage permet de convertir cette trame sous un autre 
format compatible avec la suite de la chaTne de transmission. La solution la 
plus yiementaire (et la plus courante a I'heure actuelle) est la mise bout a bout 
d'un dycodeur et d'un codeur. La trame compressee arrive sous un premier 
format, elle est dycompressee. Ce signal decompresse est alors recompresse 
sous un second format accepty par la suite de la chaTne de communication. 
Cette mise en cascade d'un dycodeur et d'un codeur est appelee "tandem". 
Cette solution est trys coGteuse en complexity (essentiellement a cause du 
recodage) et elle degrade la quality. En effet, le second codage se fait sur un 
signal dycode, qui est une version degradee du signal original. Par ailleurs, 
une trame peut rencontrer plusieurs tandems avant d'arriver a destination. On 
imagine aisyment le coQt en calcul et la perte de quality. De plus, les retards 
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li§s £ chaque operation de tandem s'accumulent et peuvent nuire a 
Tinteractivite des communications. 

Par ailleurs, la complexity pose aussi probleme dans le cadre d'un systeme de 
5 compression multi-format oCi un meme contenu est compress^ sous plusieurs 
formats. C'est le cas des serveurs de contenus qui diffusent un m§me contenu 
sous plusieurs formats adaptes aux conditions d'acc^s; de r§seaux et 
terminaux des differents clients. Cette operation de multi-codage devient 
extremement complexe a mesure qu'augmente le nombre de formats desir6s, 
10 ce qui sature rapidement les ressources du systeme. 

Un autre cas de codage multiple en paraltele est la compression multi-mode a 
decision a posteriori. A chaque segment de signal £ coder, plusieurs modes de 
compression sont effectu6s et celui qui optimise un critere donne ou obtient le 
15 meilleur compromis debit/distorsion est selectionn6. La encore, la complexite 
de chacun des modes de compression en limite le nombre et/ou conduit a 
^laborer une selection a priori d'un nombre tres restreint de modes. 

On decrit ci-apres les approches, connues, qui ont ete mises en oeuvre pour 
20 tenter de resoudre les problemes poses decrits ci-avant. 

Les nouvelles applications de communication multimedia (tels que Taudio et la 
video) necessitent souvent plusieurs codages soit en cascade (transcodage) 
soit en parallele (multi-codage et codage multi-mode a decision a posteriori). 

25 La barriere de complexite posee par tous ces codages reste un probleme & 
resoudre, malgre I'augmentation des puissances de traitement actuelles. La 
plupart de ces operations connues de codage multiple ne prennent pas en 
compte les interactions entre les formats et entre le format de E et son 
contenu. Cependant, quelques techniques de transcodage intelligent ont ete 

30 proposees qui ne se contentent plus de decoder puis recoder, mais exploitent 
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les similitudes entre formats de codages et permettent ainsi de reduire la 
complexite tout en limitant la degradation apportee. 

On decrit ci-apres des methodes de transcodage dit "intelligent'. 

5 Au sein d'une meme famille de codeurs (CELP, parametrique, par 
transformee, ou autre), tous les codeurs extraient du signal les memes 

» • * » mm 

parametres physiques. Pourtant, il existe une grande variete de modelisation 
et/ou quantification de ces parametres. Ainsi, d'un codeur a un autre, un meme 
parametre peut etre code de la meme maniere, ou, au contraire, tres 
10 differemment. 



Par ailleurs, les codages peuvent etre strictement identiques. lis peuvent etre 
identiques dans la modelisation et le calcul du parametre, mais se differencier 
simplement par la traduction du codage sous forme de bits. Enfin, ils peuvent 
etre completement differents tant par la modelisation du parametre que sa 
quantification, voire par sa frequence d'analyse ou d'echantillonnage. 

Si la modelisation et le calcul d'un parametre sont strictement identiques, y 
compris dans la traduction binaire, il suffit de recopier le champ binaire 
correspondant du train binaire genere par le premier codeur vers celui du 
second. Ce cas tres favorable se presente par exemple lors d'un transcodage 
de la norme G.729 a la norme IS-641 pour I'excitation adaptative (retards 
LTP). 

Si, pour le m§me parametre, les deux codeurs ne se distinguent que par la 
traduction binaire du parametre calcule, il suffit de decoder le champ binaire 
du premier format, puis de repasser dans le domaine binaire en utilisant la 
methode de codage selon le second format. Cette conversion peut aussi etre 
effectuee par des tables de correspondence bijective. C'est le cas par exemple 
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lors d'un transcodage des excitations fixes de la norme G.729 a la norme AMR 
(7,4 et 7,95kbit/s). 

Dans les deux cas precedents, le transcodage du parametre se fait en restant 
5 au niveau des bits. Une simple manipulation de bits permet de rendre le 
parametre compatible avec le second format de codage. En revanche, 
lorsqu'un parametre extrait du signal est modelise ou quantifie differemment 
par deux formats de codage, le passage de Tun vers I'autre ne se fait pas 
aussi simplement. Plusieurs methodes ont ete proposees. Elles operant soit 
10 au niveau du parametre, soit au niveau de Pexcitation, soit au niveau du signal 
decode. 

Pour le transcodage dans le domaine des parametres, raster au niveau du 
parametre est possible lorsque les deux formats de codage calculent un 
is parametre de la meme maniere mais le quantifient differemment. Les 
differences de quantifications peuvent etre liees a la precision choisie ou 
encore a la methode choisie (scalaire, vectorielle, predictive, ou autre). II suffit 
alors de decoder le parametre, puis de le quantifier par la methode du second 

♦ 

format de codage. Cette methode connue est appliquee actuellement, 
20 notamment pour le transcodage des gains d'excitations. Souvent, il faut 
modifier le parametre decode avant sa requantification. Par exemple, si les 
codeurs ont des frequences d'analyse du parametre ou des longueurs de 
trames/sous-trames differentes, il est courant d'interpoler/decimer les 
parametres. ^interpolation peut se faire par exemple selon la methode decrite 
25 dans le document publie US2003/033142. Une autre modification possible est 
d'arrondir le parametre a la precision qui lui est imposee par le second format 
de codage. Ce cas se presente surtout pour la hauteur de la frequence 
fondamentale (ou "pitch"). 

30 S'il n'est pas possible de transcoder un parametre en restant dans le domaine 
du parametre, on peut remonter a un niveau superieur dans le decodage. II 
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s'agit du domaine de I'excitation, sans pour autant alter jusqu'au domaine du 
signal. Cette technique a ete proposee pour les gains dans la ref6rence : 
"Improving transcoding capability of speech coders in clean and frame 
erasured channel environments" de Hong-Goo Kang, Hong Kook Kim, Cox, 
R.V., dans Speech Coding, 2000, Proceedings 2000, IEEE Workshop on 
Speech Coding, Pages 78-80. 

Enfin, une derniere solution (la plus complexe et la moins "intelligente'') 
consiste a recalculer explicitement le parametre comme le ferait le codeur, 
mais a partir d'un signal synthetise. Cette operation revient a une sorte de 
tandem partiel, seuls certains parametres etant entierement recalcules. Cette 
methode a ete appliquee a divers parametres tels que I'excitation fixe, les 
gains dans la reference IEEE precitee, ou le pitch. 

Pour le transcodage des impulsions, meme si plusieurs techniques ont ete 
developpees afin de calculer les parametres rapidement et a moindre coQt, 
peu de ces solutions aujourd'hui ont une approche intelligente pour calculer les 
impulsions d'un format a partir du parametre equivalent sous un autre format. 
En codage a analyse par synthese, le transcodage intelligent des codes 
impulsionnels n'est applique que lorsque la moderation est identique (ou 
proche). En revanche, si les moderations sont differentes, la methode du 
tandem partiel est utilisee. II faut noter que pour limiter la complexity de cette 
operation, des approches focalisees exploitant les proprietes du signal decode 
ou d'un signal derive tel qu'un signal-cible ont ete proposees. Dans le 
document precite US-2001/027393, dans I'exemple de realisation mettant en 
ceuvre un codeur par transformee MDCT, est presentee une procedure de 
changement de debit qui peut etre consideree comme un cas particulier du 
transcodage intelligent. En effet, cette procedure permet de requantifier un 
vecteur d'un premier dictionnaire par un vecteur d'un second dictionnaire. Elle 
distingue pour cela deux cas selon I'appartenance ou non du vecteur a 
requantifier dans le deuxieme dictionnaire. Si le vecteur quantifie appartient au 
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nouveau dictionnaire, la moderation est identique ; sinon, la m6thode du 
decodage partiel est appliquee. 

La presente invention propose, en se demarquant de toutes ces techniques 
connues, un transcodage multi-impulsionnel base sur une selection d'un sous- 
ensemble de combinaisons de positions d'impulsions d'un ensemble de jeux 
d'impulsions a partir d'une combinaison de positions d'impulsions d'un autre 
ensemble de jeux d'impulsions, les deux ensembles pouvant se distinguer par 
le nombre d'impulsions qu'ils comportent ainsi que par les regies regissant 
leurs positions et/ou leurs amplitudes. Ce transcodage est tres utile 
notamment pour les codages multiples en cascade (transcodages) ou en 
parallele (multi-codages et codages multi-modes). 

A cet effet, la presente invention propose tout d'abord un procede de 
transcodage entre un premier codeur/decodeur en compression et au moins 
un second codeur/decodeur en compression. Ces premier et second 
codeurs/decodeurs sont de type impulsionnel et utilisent des dictionnaires 
multi-impulsionnels dans lesquels chaque impulsion comports une position 
reperee par un indice associe. 

Le procede de transcodage au sens de I'invention comporte les eta pes 
suivantes : 

a) le cas echeant, adaptation de parametres de codage entre lesdits premier 
et second codeurs/decodeurs, 

b) obtention, a partir du premier codeur/decodeur, d'un nombre choisi de 
positions d'impulsions et d'indices de positions respectivement associes, 

c) pour chaque position d'impulsion courante d'indice donne, formation d'un 
groupe de positions d'impulsions comportant au moins la position d'impulsion 
courante et des positions d'impulsions d'indices associes immediatement 
inferieurs et immediatement superieurs a I'indice donne, 
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d) selection, en fonction de positions d'impulsions admises par le second 
codeur/decodeur, d'une partie au moins des positions d'impulsions dans un 
ensemble constitue par une union desdits groupes formes a I'etape c), et 

e) transmission des positions des impulsions ainsi selectionnees au second 
5 codeur/decodeur, pour un codage/decodage a partir desdites positions 

transmises. 

Ainsi, la selection de I'etape d) fait intervenir un nombre de positions 
d'impulsions possibles inferieur au nombre total de positions d'impulsions 
10 possibles du dictionnaire du second codeur/decodeur. 

On comprendra en particulier qu'a I'etape e), dans le cas oCi le second 
codeur/decodeur precite est un codeur, les positions d'impulsion selectionnees 
sont transmises a ce codeur, pour un codage par recherche uniquement parmi 
15 les positions transmises. Dans le cas oil le second codeur/decodeur precite 
est un decodeur, ces positions d'impulsion selectionnees sont transmises pour 
un decodage de ces positions. 

Preferentiellement, I'etape b) utilise un decodage partiel du flux binaire foumi 
20 par le premier codeur/decodeur en vue d'identifier un premier nombre de 
positions d'impulsions qu'utilise le premier codeur/decodeur, dans un premier 
format de codage. Ainsi, le nombre choisi a I'etape b) correspond 
preferentiellement a ce premier nombre de positions d'impulsions. 

25 Dans une realisation avantageuse, les etapes ci-avant sont mises en oeuvre 
par un produit programme d'ordinateur comportant des instructions de 
programme a cet effet. A ce titre la presente invention vise aussi un tel produit 
programme d'ordinateur, destine a etre stocke dans une memoire d'une unite 
de traitement, notamment d'un ordinateur ou d'un terminal mobile, ou sur un 

30 support memoire amovible et destine a cooperer avec un lecteur de I'unite de 
traitement. 
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La presente invention vise aussi un dispositif de transcodage entre des 
premier et second codeurs/decodeurs en compression, et comportant alors 
une m6moire propre a stocker des instructions d'un produit programme 
5 d'ordinateur du type d^crit ci-avant. 

D'autres caracteristiques et avantages de Pinvention apparattront & Pexamen 
de la description detaillee ci-aprds, et des dessins annexes sur lesquels : 

- la figure 1a represente schematiquement le contexte de transcodage au 
10 sens de la presente invention, dans une configuration "en cascade", 

- la figure 1b represente schematiquement le contexte de transcodage au 
sens de la presente invention, dans une configuration "en paralfele", 

- la figure 2 represente schematiquement les differents cas prevus pour les 
traitements de transcodage £ effectuer, 

15 - la figure 2a repr6sente schSmatiquement un traitement d'adaptation prevu 

pour le cas oD les frequences d'6chantillonnage des premier E et second S 
codeurs sont differentes, 

- la figure 2b repr6sente schematiquement une variante du traitement de la 
figure 2a, 

20 - la figure 3 resume les 6tapes du procede de transcodage au sens de 

Tinvention, 

- la figure 4 represente schematiquement le cas de deux sous-trames 
respectivement des codeurs E et S, de dur6es differentes L 0 et L s (avec 
L e >L s ), mais de memes frequences d'echantillonnage, 

25 - la figure 4b represente a titre d'exemple un cas pratique de la figure 4 en 

illustrant la correspondence temporelle entre un codeur G.723.1 et un 
codeur G.729, 

- la figure 5 illustre schematiquement le decoupage de Texcitation du premier 
codeur E au rythme du second codeur S, 

30 - la figure 6 illustre le cas oD Tune des pseudo-sous-trames STE'O est vide, 



* 
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la figure 7 represente schematiquement un traitement d'adaptation prevu 
pour le cas oCi les dur6es de sous-trame des premier E et second S 
codeurs sont differentes. 

On indique tout d'abord que la presente invention s'inscrit dans la modelisation 
et le codage des signaux numeriques multimedia tels que les signaux audio 
(parole et/ou sons) par des dictionnaires multi-impulsionnelsrElle peut etre - 
mise en oeuvre dans le cadre du codage/d6codage multiple en cascade ou en 
parallele ou de tout autre systeme utilisant la modelisation d'un signal par une 
representation multi-impulsionnelle et qui, a partir de la connaissance d'un 
premier jeu d'impulsions appartenant a un premier ensemble, doit determiner 
au moins un jeu d'impulsions d'un second ensemble. Par souci de concision, 
seul le cas d'un passage d'un premier ensemble vers un autre ensemble est 
decrit mais I'invention s'applique aussi dans le cas de passage vers n (n £ 2) 
ensembles. Par ailleurs, on ne d§crit ci-apres que le cas d'un "transcodage" 
entre deux codeurs, mais, bien entendu, le transcodage entre un codeur et un 
d§codeur, s'en d§duit sans difficult^ majeure. 

On considere done le cas de deux moderations d'un signal par des jeux 
20 d'impulsions correspondant a deux systdmes de codage. Sur les figures 1a et 
1b, on a represente un dispositif de transcodage D entre un premier codeur E, 
utilisant un premier format de codage COD1, et un second codeur S, utilisant 
un second format de codage COD2. Le codeur E delivre un flux (ou "train") 
binaire cod§ s C e (sous la forme d'une succession de trames codees) au 
25 dispositif de transcodage D, lequel comporte un module 10 de decodage 
partiel pour recuperer le nombre N e de positions d'impulsions utilisees dans le 
premier format de codage et les positions p e de ces impulsions. Comme on le 
verra en detail ci-apres, le dispositif de transcodage au sens de Pinvention 
procede a une extraction des voisinages de droite v e <j et de gauche v 6 ^ de 
30 chaque position d'impulsion p e et selectionne, dans I'union de ces voisinages, 
des positions d f impulsions qui seront reconnues par le second codeur S. Le 
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module 11 du dispositif de transcodage represents sur les figures 1a et 1b 
effectue done ces etapes pour delivrer cette selection de positions (notee Sj 
sur ces figures 1a et 1b) au second codeur S. On comprendra en particulier 
qu'S partir de cette selection Sj, on constitue un sous-repertoire de taille 
5 inferieure a la taille du dictionnaire qu'utilise habituellement le second codeur 
S, selon un avantage que procure Tinvention. En utilisant ce sous-repertoire, le 
codage qu'effectue le codeur S est bien entendu plus rapide car plus restraint, 
sans nuire pour autant a la qualite de codage. 

id Dans Pexemple represents sur la figure 1a, le dispositif de transcodage D 
comporte en outre un module 12 de d6codage au moins partiel du flux cod§ 
s C e que delivre le premier codeur E. Le module 12 fournit alors au second 
codeur S une version au moins partiellement decodSe s'o du signal d'origine 
s 0 . Le second codeur S delivre ensuite, sur la base de cette version s'o, un flux 

15 binaire code Scs- 

Dans cette configuration, le dispositif de transcodage D effectue done une 
adaptation de codage entre le premier codeur E et le second codeur S, en 
favorisant avantageusement un codage plus rapide (car plus restreint) aupr&s 

20 du second codeur S. Bien entendu, en variante, Pentite reference S sur les 
figures 1a et 1b peut etre un decodeur et, dans cette variante, le dispositif D 
au sens de Pinvention effectue un transcodage, proprement dit, entre un 
codeur E et un decodeur S, ce decodage s'effectuant rapidement grace aux 
informations foumies par le dispositif D. Le processus etant reversible, on 

25 comprendra que, de fagon beaucoup plus generate, le dispositif de 
transcodage D au sens de la presente invention opere entre un premier 
codeur/decodeur E et un second codeur/dScodeur S. 

On indique que Tagencement du codeur E, du transcodeur D et du codeur S 
30 peut respecter une configuration "en cascade", comme representee sur la 
figure 1a. Dans la variante representee sur la figure 1b, cet agencement peut 



WO 2005/066936 



PCT/FR2004/003008 



19 

respecter une configuration "en parallele". Dans ce cas, les deux codeurs E et 
S recoivent le signal original s 0 et les deux codeurs E et S delivrent 
respectivement les flux cod6s s C e et s cs . Bien entendu, le second codeur S n'a 
plus a recevoir ici la version s' 0 de la figure 1a et le module de decodage au 
moins partiel 12 du dispositif de transcodage D n'est plus necessaire. On 
indique en outre que, si le codeur E peut fournir une sortie compatible avec 
I'entree du module 1i (tant par rapport a son nombre d'impulsions- que par 
rapport a ses positions d'impulsions), le module 10 peut simplement etre omis 
ou "court-circuite". 

On indique en outre que le dispositif de transcodage D peut simplement etre 
equipe d'une memoire stockant les instructions pour mettre en ceuvre les 
etapes ci-avant et d'un processeur pour traiter ces instructions. 

t 

L'application de I'invention se situe done comme suit. Le premier codeur E a 
effectue son operation de codage sur un signal donne s 0 (par exemple le 
signal original). On dispose done des positions des impulsions choisies par le 
premier codeur E. Ce codeur a determine ces positions p e par une technique 
qui lui est propre lors du processus de codage. Le second codeur S doit 
realiser lui aussi son codage. Dans le cas du transcodage, le second codeur S 
ne dispose que du train binaire genere par le premier codeur et I'invention est 
ici applicable au transcodage dit "intelligent' tel que defini ci-avant. Dans le cas 
du codage multiple en parallele, le second codeur S dispose aussi du signal 
dont dispose le premier codeur et I'invention s'applique ici au "multi-codage 
—in tellig ent'. En effet, un systeme qui desire coder un meme contenu sous 
plusieurs formats peut exploiter les informations d'un premier format pour 
-simplifier les operations de codage des autres formats. L'invention peut aussi 
s'appliquer au cas particulier du codage multiple en parallele qu'est le codage 
multi-mode a decision a posteriori. 
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La pr6sente invention permet de determiner rapidement les positions p s (ou, 
notee indistinctement encore ci-aprds, Si) des impulsions pour un autre format 
de codage a partir de positions p e (ou, notee indistinctement encore ci-apr£s, 
ei) des impulsions d'un premier format. Elle permet de r6duire 

5 considerablement la complexity de calcul de cette operation pour le second 
codeur en limitant le nombre de positions possibles. A cet effet, elle utilise les 
positions choisies par le premier codeur pour definir un ensemble restreintde 
positions dans I'ensemble des positions possibles du second codeur, 
ensemble restreint dans lequel on recherchera le meilleur jeu de positions 

10 pour les impulsions. II en resulte un gain en complexity important tout en 
limitant la degradation du signal par rapport & une recherche exhaustive ou 
focalisee classique. 

On comprendra ainsi que la presente invention limite le nombre de positions 
15 possibles en definissant un ensemble restreint de positions £ partir des 
positions du premier format de codage. Elle se distingue des solutions 
existantes dans la mesure ou celles-ci utilisent uniquement les proprietes du 
signal d modeliser pour limiter le nombre de positions possibles, en privil6giant 
et/ou en 6liminant des positions. 

20 

Pr6f6rentiellement, pour chaque impulsion d'un jeu d'un premier ensemble, on 
definit deux voisinages (un droit et un gauche) de largeur ajustable plus ou 
moins contrainte et on en extrait un ensemble de positions possibles, dans 
lequel sera preselectionnee au moins une combinaison d'impulsions 
25 respectant les contraintes du deuxieme ensemble. 

Avantageusement, le procede de transcodage permet d'optimiser le 
compromis complexite/qualite en adaptant le nombre de positions d'impulsions 
et/ou les tailles respectives (en terme de combinaisons de positions 
30 d'impulsions) des voisinages droit et gauche, pour chaque impulsion. Cet 
ajustement peut etre effectue au d6but du traitement ou & chaque sous-trame 
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en fonction de la complexity autoris6e et/ou du jeu de positions de depart, 
^invention permet aussi d'ajuster/limiter le nombre de combinaisons de 
positions en favorisant avantageusement les voisinages immediats. 

5 Comme indiquS ci-avant, la pr6sente invention vise aussi un produit 
programme d'ordinateur dont I'algorithme est con$u notamment pour 
^extraction de* positions voisines qui facilite la composition des combinaisons 
d'impulsions du deuxfeme ensemble. 

Comme indique pr^cedemment, Ph6terogeneit6 des reseaux et des contenus 
peut mettre en presence des formats de codage tres varies. Les codeurs 
peuvent se distinguer par de nombreuses caracteristiques. En particulier, deux 
d'entre elles d^terminent sensiblement le mode de fonctionnement de 
I'invention. II s'agit de la frequence d'echantillonnage et de la duree d'une 
sous-trame. Ci-apr§s f les differents cas possibles sont pr6sent£s en 
correspondance de mises en oeuvre de I'invention selon ces differents cas. 

La figure 2 synthetise les differents cas. Dans un premier temps, on obtient : 

- les nombres de positions d'impulsions N e ,N s , 

- les frequences d'echantillonnage F e ,F s respectives, 

- et les durees de sous-trame L e ,L s 
qu'utilisent respectivement les codeurs E et S (etape 21). 
Ainsi, on comprendra deja que les etapes d'adaptation et de recuperation des 
nombres de positions d'impulsions N e , N s peuvent avantageusement etre 
interverties ou simplement menees simultanement. 

Au test 22, on compare les frequences d'echantillonnage. Si les frequences 
sont egales, on compare, au test 23, les durees de sous-trame. Sinon, on 
adapte les frequences d'echantillonnage, a I'etape 32, selon un procede decrit 
ci-apres. A Tissue du test 23, si les durees de sous-trame sont egales, on 
compare, au test 24, les nombres de positions d'impulsions N e et N s utilises 
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respectivement par le premier et !e second format de codage. Sinon, on 
adapte les dur£es de sous-trame a I'etape 33 selon un proced& qui sera aussi 
d6crit ci-apr6s. On comprendra que les etapes 22, 23, 32 et 33 d6finissent 
ensemble Tetape a) d'adaptation des param6tres de codage cit6e ci-avant. On 
5 indique que les etapes 22 et 32 (adaptation des frequences d'echantillonnage), 
d'une part, et les etapes 23 et 33 (adaptation des durees de sous-trame), 
d'autre part,- peu vent etre inversees. 

On decrit d'abord ci-apres le cas oCi les frequences d'echantillonnage sont 
10 egales et les durees de sous-trames sont egales. 

Ce cas est le plus favorable. Cependant, il faut distinguer encore le cas oD le 
premier format utilise plus d'impulsions que le second (N e ^ N s ), et le cas 
contraire (N© < N s ), selon le resultat du test 24. 

15 * Cas N e £ N s de la figure 2 

Le principe est le suivant. En consid6rant les deux codeurs E et S, leurs 

repertoires utilisent respectivement N e et N s impulsions £ chaque sous-trame. 

Le codeur E a calculi les positions de ses N e impulsions sur la sous-trame s e . 
20 On note ci-apr6s e\ (ou, indistinctement, p e ) ces positions. L'ensemble restreint 
P s des positions privilegiees pour les impulsions du repertoire du codeur S est 
alors constitue de N e positions eiet de leurs voisinages. 



25 Les valeurs de v' d et , choisies a Tetape 27 de la figure 2, sont plus ou 

moins grandes selon la complexite et la qualite desirees. Ces taiiles peuvent 
etre fixees arbitrairement au debut du traitement, ou etre choisies a chaque 
sous-trame s e . 




oCi v d et v 



' > 0 sont les taiiles des voisinages droit et gauche de Timpulsion i. 
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A I'etape 29 de la figure 2, Pensemble P s contient alors chaque position e\ ainsi 
que ses v' d voisins de droite et ses voisins de gauche. 

5 Pour chacune des N s impulsions du repertoire du codeur S, il faut ensuite 
definir les positions que cette impulsion a le droit de prendre parmi celles 

* * * 

proposees par P s . 

Pour cela, on introduira des regies presidant a la construction du repertoire de 
10 S. On suppose que les N s impulsions de S appartiennent a des sous- 
ensembles pre-definis de positions, un nombre donne d'impulsions partageant 
un meme sous-ensemble de positions autorisees. Par exemple, les 10 
impulsions du mode 12,2 bit/s du codeur 3GPP NB-AMR sont reparties 2 par 2 
dans 5 sous-ensembles differents, comme le montre la table 3 donnee ci- 
15 avant. On note N' s le nombre de sous-ensembles de positions differents (N' s £ 
N s dans cet exemple puisque N' s =5), et 7j (pour j=1 a N' s ) les sous-ensembles 
de positions definissant le repertoire de S. 

A partir de I'ensemble P s , les N' s sous-ensembles Sj issus de I'intersection de 
20 P s avec I'un des ensembles T\ sont constitues, a I'etape 30 de la figure 2, selon 
la relation : 

Sj= P s n 7j 

Les voisinages v' d et doivent §tre d'une taille suffisante pour qu'aucune 

25 intersection ne soit vide. On doit permettre ainsi un reajustement des tallies de 
voisinage, si necessaire, en fonction du jeu d'impulsions de depart. C'est 
Tobjet du test 34 de la figure 2, avec une augmentation de la taille des 
voisinages (etape 35) et retour vers la definition de I'union P s des groupes 
formes a I'etape c) (etape 29 sur la figure 2) si I'une des intersections est vide. 
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Au contraire, si aucune intersection Sj n'est vide, c'est le sous-r6pertoire 
constitu& par ces intersections Sj qui est envoye au codeur S (§tape de fin 31). 

Avantageusement, I'invention exploite. la structure des repertoires. Par 
5 exemple, si le repertoire du codeur S est de type ACELP, ce sont les 
intersections des positions des pistes avec P s qui sont calculees. Si le 
repertoire du codeur E est aussi de type ACELP, la procedure d'extraction des 
voisinages exploite aussi la structure en pistes et les deux stapes d'extraction 
des voisinages et composition des sous-ensembles restraints de positions, 
10 sont judicieusement assoctees. En particulier, il est interessant que 
I'algorithme d'extraction des voisinages prenne en compte la composition des 
combinaisons d'impulsions selon les contraintes du deuxieme ensemble. 
Comme on le verra plus loin, des algorithmes d'extraction de voisinages sont 
elabores pour faciliter la composition des combinaisons d'impulsions du 
15 deuxieme ensemble. Un exemple d'un tel algorithme est illustr6 par I'un des 
modes de realisation donnes plus loin (ACELP a 2 impulsions vers ACELP a 4 
impulsions). 

i 

Le nombre de combinaisons de positions possibles est ainsi restraint et la 
20 taille du sous-ensemble du repertoire du codeur S est generalement tres 
inferieure a celle du repertoire original, ce qui reduit grandement la complexite 
de i'avant-derniere etape du transcodage. On precise ici que le nombre de 
combinaisons de positions d'impulsions d6finit la taille du sous-ensemble 
precite. On precise en outre que c'est le nombre de positions d'impulsions que 
25 Ton diminue au sens de I'invention, ce qui entraTne une diminution du nombre 
de combinaisons de positions d'impulsions et permet alors d'obtenir un sous- 
repertoire de taille restreinte. 

L'etape reference 46 sur la figure 3 consiste alors a lancer la recherche du 
30 meilleur jeu de positions pour les N s impulsions dans ce sous-repertoire de 
taille restreinte. Le critere de selection est similaire a celui du processus de 
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codage. Pour r6duire davantage la complexity, on peut accelerer I'exploration 
de ce sous-repertoire en utilisant des techniques de focalisation connues 
d6crites ci-avant. 

La figure 3 resume les etapes de I'invention pour le cas oCi le codeur E utilise 
au moins autant d'impulsions que le codeur S. On indique toutefois que, 
comme on I'a d£ja vu en reference 3 la figure 2, si le nombre de positions N s 
au second format (le format de S) est superieur au nombre de positions N e au 
premier format (le format de E), le traitement pr6vu ne se distingue que par 
quelques variantes avantageuses qui seront decrites plus loin. 

En bref, ces etapes de la figures 3 se resument comme suit. Aprds une etape 
a) eventuelle d'adaptation des parametres de codage (si necessaire et 
representee d cet effet par des traits pointilles sur la figure 3 dans le bloc 41) : 
- recuperation des positions ei des impulsions du codeur E, et 
pr§ferentiellement d'un nombre N e de positions (etape 42 
correspondant § I'etape b) precitee), 
. extraction des voisinages et formation des groupes de voisinages selon 
la relation : 



formant la selection de Tetape d) precitee et correspondant & I'etape 44 

representee sur la figure 3, et 
- et transmission de cette selection au codeur S (etape 45 correspondant 

a I'etape e) precitee). 
On indique qu'apres cette etape 45, le codeur S choisit ensuite un jeu de 
positions dans le repertoire restraint obtenu a I'etape 44. 




(etape 43 correspondant a I'etape c) precitee) 



- composition des sous-ensembles restraints de positions {Sj= P s nTj> 
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Le procede se poursuit done par une 6tape 46 de recherche dans ce sous- 
repertoire re9u par le codeur S d'un jeu de positions optimal (opt(Sj)) 
comportant le second nombre N s de positions, comme indiqu6 ci-avant. Cette 
5 etape 46 de recherche du jeu de positions optimal est mise en ceuyre 
pr§f6rentiellement par une recherche focalis§e pour acc6!6rer Texploration du 
sous-r6pertoire. Le traitement se poursuit naturellement par le codage 
qu'effectue ensuite le second codeur S. 

10 On decrit maintenant les traitements prevus pour le cas oCi le nombre 
d'impulsions N e utilisees par le premier format de codage est inferieur au 
nombre d'impulsions N s utilises par le second format de codage, 

* cas N e < N s de la figure 2 

15 Si le format de S utilise plus d'impulsions que le format de E, le traitement est 
similaire au traitement expose ci-dessus. Cependant, il peut arriver que des 
impulsions du format de S n'aient pas de positions dans le repertoire restraint 
Dans ce cas, dans une premiere realisation, on autorise toutes les positions 
possibles pour ces impulsions. Dans une seconde realisation, pr6feree, on 

20 augmente simplement la taille des voisinages £ V d et V g , £ Petape 28 de la 
figure 2. 

* cas Ne<N 8 <2N e de la figure 2 

Un cas particulier doit §tre souligne ici. Si N e est proche de N s , typiquement 
25 N e <Ns<2N e , alors une maniere preferee de determiner les positions est 
envisageable, bien que le traitement precedent reste encore tout a fait 
applicable. On peut encore gagner en comptexite en fixant directement les 
positions des impulsions de S a partir de celles de E. En effet, les N e 
premieres impulsions de S sont placees sur les positions de celles de E. Les 
30 Ns-Ne impulsions restantes sont placees le plus pres possible (au voisinage 
immediat) des N e premieres impulsions. Ainsi, on teste a I'etape 25 de la 
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figure 2 si les nombres N e et N s sont proches (avec N e >N s ) et, dans 
I'affirmative, on proc&de comme d6crit ci-avant pour le choix des positions 
d'impulsions a l'6tape 26. 

5 Bien entendu, dans les deux cas N e <N s et N e <N s <2N e , si, malgr6 ces 
precautions, Tune des intersections Sj est vide, on augmente simplement la 
taiile des voisinages V* 8 ;V*di "Ar fetape 35, comme d£crit dans Me cas oCr 
N e * N s . 

Finalement, dans tous les cas, si aucune intersection Sjn'est vide, on transmet 
10 le sous-r6pertoire forme par les Sj au second codeur S (£tape 31). 

On decrit maintenant les traitements pr6vus a Fetape d'adaptation a) lorsque 
les parametres de codage des premier et second formats ne sont pas les 
m § meSi en particulier en terme de frequences d'echantillonnage et de durees 
15 de sous-trame. 

On distingue alors les cas ci-apr6s. 

* Durees de sous-trame egales mais frequences d'echantillonnages 

20 differentes 

Cette situation correspond au cas "n" pour le test 22 et r, o" pour le test 23 de la 
figure 2. L'adaptation a) porte alors sur T§tape 32 de la figure 2. 

On ne peut plus appliquer directement ici le traitement precedent car les deux 
25 formats n'ont pas le meme decoupage du temps. En effet, du fait des 
frequences d'echantillonnage differentes, les deux trames ne comportent pas 
le meme nombre d'echantillons sur une meme duree. 

Plutot que de determiner les positions des impulsions du format du codeur S 
30 sans tenir compte de celles du format du codeur E, comme le ferait un tandem, 
on propose ici deux traitements selon deux modes de realisation distincts. Ces 
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traitements sont de faible complexity en etablissant une correspondence entre 
les positions des deux formats qui permet alors de se ramener ensuite au 
traitement decrit ci-avant (comme si les frequences d'echantillonnage etaient 
egales). 



Le traitement du premier mode de realisation utilise une quantification directe 
de I'echelle temporelledu premier format par celle du deuxieme format. Cette 
operation de quantification qui peut etre tabulee ou calculee par une formule, 
permet ainsi de trouver, pour chaque position d'une sous-trame du premier 
format, son Equivalent dans une sous-trame du second format et 
reciproquement. 

Par exemple, la correspondance entre les positions p e et p 3 dans les sous- 
trames des deux formats peut etre definie par la formule suivante : 



Ps = 



F f-*p e +0,5 



, 0^ p e < L e et 0^ p s < L. 



oCi F e et F s sont les frequences d'echantillonnages respectives de E et S, 
et L e et L s leurs longueurs de sous-trame, 
L J denotant la partie entiere. 

Selon les caracteristiques de I'unite de traitement, cette correspondance 
pourra utiliser la formule ci-avant ou avantageusement etre tabulee pour les L e 
valeurs. On peut aussi choisir une solution intermediaire en ne tabulant que 

les l e premieres valeurs (/ e d etant le plus grand commun diviseur de U 

a 

et L s ), les positions restantes se deduisant alors aisement. 

II faut noter qu'on peut aussi faire correspondre plusieurs positions de la sous- 
trame de S a une position d'une sous-trame de E. Par exemple, en retenant 

les positions immediatement inferieure et immediatement superieure a p e . 

F e 
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A partir de Pensemble des positions p s correspondant aux positions p 0l on 
applique le traitement general d6crit plus haut (extraction des voisinages, 
composition des combinaisons d'impulsions, selection de la combinaison 
5 optimale). 

On retrouvera ce cas de dur6es- de sous-trame 6gales mais deHtequences 
d'6chantillonnage differentes sur les tables 5a £ 5d ci-apr§s, en reference d un 
exemple de realisation oCi le codeur E est de type 3GPP NB-AMR et le codeur 

10 S est de type WB-AMR. Le codeur NB-AMR a une sous-trame de 40 
6chantillons pour une frequence d'6chantil!onnage de 8 kHz. Le codeur WB- 
AMR utilise, quant a lui, 64 6chantillons par sous-trame a 12,8 kHz. Dans les 
deux cas, la sous-trame a une duree de 5 ms. La table 5a donne la 
correspondence des positions dans une sous-trame du NB-AMR vers une 

15 sous-trame du WB-AMR, et la table 5b la correspondance inverse. Les tables 
de correspondance restreinte sont donn6es dans les tables 5c et 5d. 



NB-AMR 


0 


1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


11 


12 


13 


14 


15 


16 


17 


18 


19 


20 


21 


22 


23 


24 


25 


26 


27 


28 


29 


30 


31 


32 


33 


34 


35 


36 


37 


38 


39 


WB-AMR 


J 


2 


3 


5 


6 


8 


10 




13 


14 


16 


18 


19 


21 


22 


24 


26 


27 


29 


3d 


32 


34 


35 


37 


38 


40 


42 


43 


45 


46 


48 


50 


51 


53 


54 


56 


58 


59 


61 


62 



Table 5a: Table de correspondance temporelle du NB-AMR vers WB-AMR 



WB-AMR 


0 


1 


2 


3 


4 


5 


6 


7 


8 


9 


10 


11 


12 


13 


14 


15 


16 


17 


18 


19 


20 


21 


22 


23 


24 


25 


26 


27 


28 


29 


30 


31 


NB-AMR 


0 


1 


1 


2 


3 


3 


4 


4 


5 


6 


6 


7 


8 


8 


9 


9 


10 


11 


11 


12 


13 


13 


14 


14 


15 


16 


16 


17 


18 


18 


19 


19 


WB-AMR 


32 


33 


34 


35 


36 


37 


38 


39 


40 


41 


42 


43 


44 


4S 


46 


47 


48 


49 


50 


51 


52 


53 


54 


55 


56 


57 


58 


59 


60 


61 


62 


63 


NB-AMR 


20 


21 


21 


22 


23 


23 


24 


24 


25 


i4 


26 


27 


28 


28 


29 


29 


30 


31 


31 


32 


33 


33 


34 


34 


35 


36 


36 


37 


38 


38 


39 


39 



Table 5b: Table de correspondance temporelle du WB-AMR vers NB-AMR 



Positions NB-AMR 


0 


1 


2 


3 


4 










Positions WB-AMR 


0 


2 


3 


5 


6 



20 Table 5c: Table de correspondance temporelle restreinte du NB-AMR vers WB-AMR 
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Positions WB-AMR 


0 


1 


2 


3 


4 


5 


6 


7 


Positions NB-AMR 


0 


1 


1 


2 


2 


3 


4 


4 



Table 5d: Table de correspondance temporelle restreinte du WB-AMR vers NB-AMR 



En bref, en se referent & la figure 2a, on pr6voit les Stapes ci-aprSs : 
a1) de quantification directe d'6chelle temporelle de la premiere frequence 
5 vers la seconde frequence (6tape 51 de la figure 2a), 

a2) et de determination, en fonction de cette quantification, de chaque position 
d'impulsion dans une sous-trame au second format de codage caracteris6 par 
la seconde frequence d'echantillonnage, & partir d'une position d'impulsion 
dans une sous-trame au premier format de codage caract§ris6 par la premiere 
10 frequence d'6chantillonnage (etape 52 de la figure 2a). 

En termes genSraux, I'etape a1) de quantification s'effectue par calcul et/ou 
tabulation a partir d'une fonction qui, a une position p e d'impulsion dans une 
sous-trame au premier format, fait correspondre une position p s d'impulsion 
15 dans une sous-trame au second format, et cette fonction se presente 
sensiblement comme une combinaison lineaire faisant intervenir un coefficient 
multiplicatif correspondant au rapport de la seconde frequence 
d'echantillonnage sur la premiere frequence d'6chantillonnage. 

20 Par ailleurs, pour passer inversement d'une position d'impulsion dans une 
sous-trame au second format p s a une position d'impulsion dans une sous- 
trame au premier format p e , on applique bien entendu une fonction inverse de 
cette combinaison lineaire appliquee a une position d'impulsion dans une 
sous-trame au second format p s . 

25 

On comprendra que le procede de transcodage est completement reversible et 
s'adapte aussi bien dans un sens de transcodage (E->S) que dans Pautre 
(S->E). 
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Dans un second mode de realisation de I'adaptation des frequences 
d'echantillonnage, on utilise un principe classique de changement de 
frequence d'echantillonnage. On part de la sous-trame contenant les 
impulsions trouvees par le premier format. On sur-echantillonne a la frequence 
6gale au plus petit commun multiple des deux frequences d'echantillonnage F e 
et F s . Puis, apres filtrage passe-bas, on sous-echantillonne pour revenir a la 
frequence d'echantillonnage du second format, c'est-a-dire F s . On obtient une 
sous-trame a la frequence F s contenant les impulsions de E filtrees. La encore, 
on peut tabuler le r§sultat des operations de sur-echantillonnage/filtrage 
passe-bas/sous-echantillonnage pour chaque position possible d'une sous- 
trame de E. Ce traitement peut aussi s'effectuer par calcul "en ligne". Comme 
dans le premier mode de realisation de I'adaptation des frequences 
d'echantillonnage, on pourra associer une seule ou plusieurs positions de S a 
une position de E, comme expliqu6 ci-apr6s, et appliquer le traitement general 
au sens de I'invention decrit ci-avant. 

Comme illustr6 dans la variante representSe sur la figure 2b, on prevoit les 
etapes ci-aprds : 

a'1) sur-§chantillonner une sous-trame au premier format de codage 
20 caracterise par la premiere frequence d'echantillonnage, a une frequence F pC m 
egale au plus petit commun multiple des premiere et seconde frequences 
d'echantillonnage (etape 53 de la figure 2b), et 

a'2) appliquer a la sous-trame sur-echantillonn§e un filtrage passe-bas (6tape 
54 de la figure 2b), suivi d'un sous-echantillonnage, pour atteindre une 
25 — fr equ ence d'echantillonnage correspondant a la seconde frequence 
d'echantillonnage (etape 55 de la figure 2b). 

Le precede se poursuit par I'obtention, pref6rentiellement par seuillage, d'un 
nombre de positions eventuellement variable, ces positions etant adaptees 
des impulsions de E (6tape 56) comme dans le premier mode de realisation ci- 
30 avant. 



10 



15 
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* Frequences d'echantillonnages egales mais durees de sous-trame 
differentes 

On dgcrit maintenant le traitement prevu dans le cas 0C1 les frequences 
d'echantillonnage sont 6gales mais les dur§es de sous-trame sont differentes. 
5 Cette situation correspond au cas "n" pour le test 23 mais "o" pour le test 22 
de la figure 2. ^adaptation a) porte alors sur I'etape 33 de la figure 2. 

Comme dans le cas ci-avant, on ne peut pas appliquer directement I'etape 
d'extraction des voisinages telle quelle. II faut d'abord rendre compatibles les 

10 deux sous-trames. Ici, les sous-trames sont diff6rentes par leurs tailles. Face £ 
cette incompatibility, plutot que de calculer les positions des impulsions 
comme le fait le tandem, une realisation prefer6e propose une solution a faibie 
complexity permettant de determiner un repertoire restreint de combinaisons 
de positions pour les impulsions du second format £ partir des positions des 

15 impulsions du premier format. Cependant, la sous-trame de S et celle de E 
n'etant pas de m§me taille, il n'est pas possible d'6tablir une correspondence 
temporelle directe entre une sous-trame de S et une sous-trame de E. Comme 
le montre la figure 4 (dans laquelle les sous trames de E et S sont designees 
respectivement par ST E et ST S ), les frontteres des sous-trames des deux 

20 formats ne sont pas alignees et au cours du temps ces sous-trames se 
d£calent Tune par rapport a Tautre. 

Dans un mode de realisation prefere, on propose de decouper Texcitation de E 
en pseudo-sous-trames de la taille de celles de S et au rythme de S. Sur la 

25 figure 5, on a represents les pseudo sous-trames notees STe*. En pratique, 
cela revient aussi & effectuer une correspondence temporelle entre les 
positions dans les deux formats en prenant en compte la drff^rence de taille 
des sous-trames pour aligner les positions relativement a une origine 
commune a E et S. La determination de cette origine commune est decrite en 

30 detail plus loin. 
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Une position p% (respectivement p° s ) du premier format (respectivement du 
second format) par rapport a cette origine coTncide avec la position p e 
(respectivement p s ) de la sous-trame / e (respectivement j s ) de E 
(respectivement S) relativement a cette sous-trame. On a ainsi : 



A une position p 0 de la sous-trame i 0 du format de E correspond-|a position p s 
de la sous-trame j s du format de S, p s et j s etant respectivement le reste et le 
quotient de Ja division euclidienne par L s de la position p° e de p e par rapport a 
10 une origine O commune & E et S : 



avec OS p e < L g et OS p s <L s 
|_ J denotant la partie entiere, s denotant le modulo, I'indice d'une sous-trame 

15 de E (respectivement S) etant donne par rapport Porigine commune O. 

Ainsi, les positions p e situees dans une sous-trame j 8 sont utilisees pour 
determiner, selon le traitement general decrit ci-avant, un ensemble restraint 
de positions pour des impulsions de S dans la sous-trame j s . Toutefois, 

20 lorsque U > U, il peut arriver qu'une sous-trame de S ne contienne aucune 
impulsion. Dans Pexemple de la figure 6, les impulsions de la sous-trame 
STE0 sont representees par des traits verticaux. Le format de E peut tres bien 
concentrer les impulsions de STE0 en fin de sous-trame si bien que la pseudo 
sous-trame STE'O ne contient alors aucune impulsion. Toutes les impulsions 

25 placees par E se retrouvent dans STE'1 lors du d^coupage. Dans ce cas, une 
recherche focalisee classique est preferentiellement appliquee & la pseudo 
sous-trame STE'O. 



p°e=p e +/eU et pVPa+jsU avec OS p e < U et OS p s < L s 




30 



On d6crit maintenant des realisations preferees pour la determination d'une 
origine temporelle O commune aux deux formats. Cette reference commune 
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constitue la position (numero 0) a partir de laquelle sont numerotees les 
positions des impulsions dans les sous-trames suivantes. Cette position 0 peut 
etre definie de differentes manieres, dependant du systeme exploitant le 
precede de transcodage au sens de la presente invention. Par exemple, pour 
un module de transcodage inclus dans un equipement d'un systeme de 
transmission, il sera naturel de prendre pour origine la premiere position de la 
premiere trame recue apres la mise en route de Pequipement: - 

Toutefois, I'inconvenient de ce choix est que les positions prennent des 
valeurs de plus en grandes et il peut devenir necessaire de les limiter. Pour 
cela, il suffit de remettre a jour la position de I'origine commune a chaque fois 
que cela est possible. Ainsi, si les longueurs respectives L© et L s des sous- 
trames de E et S, sont constantes au cours du temps, la position de I'origine 
commune est remise a jour a chaque fois que les frontieres des sous-trames 
de E et S sont alignees. Cela arrive periodiquement, la periode (en 
echantillons) etant egale au plus petit commun multiple de L e et L s . 

On peut aussi envisager le cas ou L e et/ou U ne sont pas constantes dans le 
temps. II n'est plus possible de trouver un multiple commun aux deux 
longueurs de sous-trame, notees a present L e (n) et L s (n), n representant le 
num6ro de la sous-trame. Dans ce cas, il convient de sommer au fur et a 
mesure les valeurs L e (n) et L s (n) et comparer k chaque sous-trame les deux 
sommes obtenues : 

k k' 

A chaque fois que I'on a T e (k) = T s (k'), I'origine commune est remise a jour (et 
prise a la position kx|_e ou encore a k'x|_ s ). Quant aux deux sommes T e et T s , 
elles sont preferentiellement reinitialisees. 



WO 2005/066936 



PCT/FR2004/003008 



35 

En bref et plus gen6ralement, en appelant premiere (respectivement seconde) 
duree de sous-trame la dur§e de sous-trame du premier (respectivement 
second) format de codage, les 6tapes d'adaptation effectu6es lorsque les 
5 durees de sous-trame sont differentes sont r6sumees sur la figure 7 et sont 
preferentiellement les suivantes : 

a20) definition d*une origine commune O aux sous-trames des premier et 
second formats (etape 70), 

a21) decoupage des sous-trames successives du premier format de codage 
10 caracterise par une premiere duree de sous-trame, pour former des pseudo- 
sous-trames de dur6es U e correspondantes a la seconde dur6e de sous-trame 
(etape 71), 

a22) mise d jour de Porigine commune O (etape 79), 

a23) et determination de correspondance entre les positions d'impulsions dans 
is les pseudo-sous-trames p' e et dans les sous-trames au second format (etape 
80). 

Preferentiellement, pour determiner Torigine commune O, on discrimine au test 
72 de la figure 7 les cas suivants : 
20 - les premiere et seconde durees sont fixes dans le temps (sortie "o" du test 
72), et 

- les premiere et seconde durees varient dans le temps (sortie "n" du test 72). 

Dans le premier cas, la position temporelle de Porigine commune est remise 
25 periodiquement a jour (etape 74) a chaque instant od des frontferes de sous- 
trames respectives de premiere duree St(U) et de seconde duree St(L s ) sont 
alignees dans le temps (test 73 effectue sur ces frontieres). 
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Dans le second cas, pref6rentiellement : 

a221) on effectue successivement les deux sommations respectives des sous- 
trames au premier format T e (k) et des sous-trames au second format T s (k') 
(6tape 76), 

5 a222) on detecte une occurrence d'une egalite entre lesdites deux sommes, 
d6finissant un instant de remise £ jour de ladite origine commune (test 77), 
a223) on reinitialise les deux sommes pr6cit6es (6tape 78), apr6s ladite - 
occurrence, pour une future detection d'une prochaine origine commune. 

10 Maintenant, dans le cas oCi les dur6es de sous-trame et les frequences 
d'echantillonnage sont differentes, il suffit de combiner judicieusement les 
algorithmes de correspondance entre les positions de E et S decrites dans les 
deux cas precedents. 

15 * EXEMPLES DE REALISATION 

On d6crit maintenant trois exemples de realisation du transcodage au sens de 
Tinvention. Ces exemples de realisation decrivent la mise en oeuvre des 
traitements prevus dans les cas presentes ci-avant dans des codeurs de 
parole & analyse par synthese normalises. Les deux premiers modes illustrent 
20 le cas favorable oCi les frequences d'echantillonnage, comme les durees des 
sous-trames, sont identiques. Le dernier exemple illustre le cas oD les durees 
des sous-trames sont differentes. 

* Exemple de realisation n°1 

25 Le premier exemple de realisation est applique au transcodage intelligent 
entre le modele MP-MLQ du G.723.1 £ 6,3 kbit/s et le modeie ACELP a 
4 impulsions du G.723.1 a 5,3 kbit/s. 

Un transcodage intelligent du debit haut vers le debit bas du G.723.1 met en 
30 presence un modele MP-MLQ a 6 et 5 impulsions avec un modele ACELP a 
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4 impulsions. L'exemple de realisation presents ici permet de determiner ies 
positions des 4 impulsions de I'ACELP a partir des positions des impulsions du 
MP-MLQ. 

5 On rappelle ci-apres le fonctionnement du codeur G.723.1 . 

Le codeur multi-debits Ult-T G.723.1 et ses repertoires multi-impuisiohnels ont 
ete presentes ci-avant. II est precise seulement qu'une trame du G.723.1 
comporte 240 echantillons a 8 kHz, et qu'elle est divisee en quatre sous- 

10 trames de 60 echantillons. La meme restriction est imposee aux positions des 
impulsions de tout vecteur-code de chacun des trois dictionnaires multi- 
impulsionnels. Ces positions doivent toutes avoir la meme parite (toutes paires 
ou toutes impaires). La sous-trame de 60(+4) positions est ainsi decoupee en 
deux grilles de 32 positions. La grille paire comporte Ies positions numerotees 

is [0, 2, 4,..., 58, (60,62)]. La grille impaire comporte Ies positions [1, 3, 5,..., 
59,(61,63)]. Pour chaque debit, I'exploration du repertoire, meme non 
exhaustive, reste complexe comme indique precedemment. 

On decrit maintenant la selection d'un sous-ensemble du repertoire ACELP du 
20 G.723.1 a 5,3 kbit/s a partir d'un element d'un repertoire MP-MLQ du G.723.1 
a 6,3 kbit/s. 



On cherche a modeliser le signal d'innovation d'une sous-trame par un 
element du repertoire ACELP du G.723.1 a 5,3 kbit/s connaissant I'element du 
25 -repertoire MP-MLQ du G.723.1 a 6,3 kbit/s determine lors d'un premier 
codage. On dispose done des N e positions (N e =5 ou 6) des impulsions 
choisies par le codeur G.723.1 a 6,3 kbit/s. 
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Par exemple, on peut supposer que les positions extraites du train binaire du 
codeur G.723.1 a 6,3kbit/s pour une sous-trame dont I'excitation est modelis6e 
par N Q =5 impulsions sont : 

e 0 = 0; e!=8; e 2 =28; e 3 =38; e 4 = 46; 

On rappelle qu'aucune adaptation des frequences d'echantillonnage ou des 
dur6es de sous-trames n'est d faire ici. Apr§s cette 6tape de recuperation des 
positions ei, une etape suivante" consiste alors & extraire directement les 
voisinages droits et gauches de ces 5 impulsions. Les voisinages droits et 
gauches sont pris ici egaux £ 2. L'ensemble P s des positions s6lectionn6es 
est : 

p s = {- 2,-lAtf {6,7,8,9,10}|J {26^7,28,2930)lJ {36,37,3 8,39,40}(J {44,45,46,47,48} 

La troisfeme etape consiste a composer l'ensemble restreint des positions 
possibles pour chaque impulsion (ici une piste) du repertoire ACELP du 
G.723.1 a 5,3 kbit/s en prenant N s =4 intersections de P s avec les 4 ensembles 
des positions des pistes paires (respectivement impaires) autoris6es par ce 
dernier repertoire (comme represents dans la table 1). 

Pour la parite paire : 

S 0 = /ififoAte*' S x = P s f] {2,10,18,. ..,58}; S 2 = P s f[ {4,12,20,-.., 52, (60)}; 

S3 = F 5 f|{6„14,22, -,54,(62)}; 

d'OU : S 0 = {0,8,40,48}; S x = {2,10,26,}; S2 = {28,36,44>, S3 = {6,30,38,46}; 

Pour la parite impaire : 

Sb-^nG" 9 ""'' 57 * S!=i>f|{3,ll,. .,59}; S2 = /> 5 f| {5,13,. .,53,(61)}; 
S3=^n^ 7 » 15 ' '"• 55 »( 63 )^ 

d'oCl : S Q S 1= {27}; Si = {29,37,45>, S3 = {7,39,47}; 

La combinaison de ces positions selectionnees constitue le nouveau repertoire 
restreint dans lequel s'effectuera la recherche. Pour cette derniere etape, la 
procedure de selection du jeu de positions optimales s'appuie sur le critere 
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CELP comme le fait le G.723.1 au mode 5,3 kbit/s, Uexploration petit §tre 
exhaustive ou, de preference, focalis&e. 

Le nombre de combinaisons de positions dans le repertoire restreint est 6gal £ 
180 (=4*3*3*4+2*1*3*3) au lieu des 8192 (=2*8*8*8*8) combinaisons de 
positions du r6pertoire ACELP du G.723.1 3 5,3 kbit/s. 

On indtque qu'on peut restreindre davantage le nombre de combinaisons en 
ne consid6rant que la parity choisie au mode 6,3 kbit/s (dans Texemple cite la 
parite paire). Dans ce cas, le nombre de combinaisons du repertoire restreint 
estegal d 144. 

II peut arriver (selon les taille des voisinages considerees) que pour une des 
quatre impulsions, Fensemble P s ne contienne aucune position pour une piste 
du modele ACELP (cas oO Tun des ensemble S, est vide). Ainsi, pour des 
voisinages de taille 2, quand les positions des N e impulsions sont toutes sur la 
meme piste, P s ne contient que des positions de cette piste et des pistes 
adjacentes. Dans ce cas, selon le compromis qualite/complexite desire, il est 
possible soit de remplacer I'ensemble S/ par T t (ce qui revient a ne pas 
restreindre Tensemble des positions de cette piste), soit d'augmenter le 
voisinage droit (ou gauche) des impulsions. Par exemple, si toutes les 
impulsions du code a 6,3 kbit/s sont sur la piste 2, avec des voisinages droit et 
gauche egaux a 2, la piste 0 n'aura pas de positions quelle que soit la parite. II 
suffit alors d'augmenter de 2 la taille du voisinage gauche et/ou droit pour 
attribuer des positions a cette piste 0. 

Pour illustrer cette realisation, on part de Texemple suivant : 

e 0 =4; ei = 12; e 2 = 20; e 3 = 36; e 4 = 52; 

L'ensemble P s des positions selectionnees est : 

p s = {2A4A6}jJ {10,1 U243,14}|J {l 8,1 9^0,2 1,22}|J {34,3 5^6,373 *\j {50,51,52,53^4} 
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En supposant que Ton veuille garder la meme parit6, la repartition initiate de 
ces positions pour les 4 impulsions est : 

S o =0; S*={2, 10, 18, 34, 50}; S 2 ={4, 12, 20, 36, 52}; S 3 ={6, 14, 22, 38, 54}; 
En augmentant de 2 le voisinage gauche des impulsions, on obtient : 
So={0. 8, 16, 32, 48}; S*={2, 10, 18, 34, 50}; 
S 2 ={4, 12, 20, 36, 52}; S 3 ={6, 14, 22, 38, 54} 
(avec done S Q *0). 

* Exemple de realisation n°2 

Le second exempie suivant illustre ('application de ('invention aux 
transcodages intelligents entre des modules ACELP de meme longueur. En 
particular, ce second exemple de realisation est appliqu6 au transcodage 
intelligent entre I'ACELP & 4 impulsions du G.729 £ 8 kbit/s et PACE LP a 2 
impulsions du G.729 d 6,4 bits/s. 

Un transcodage intelligent entre les modes 6,4 kbit/s et 8 kbit/s du codeur 
G.729, met en presence un repertoire ACELP d deux impulsions et un second 
& quatre impulsions. L'exemple pr6sent6 ici permet de determiner les positions 
de 4 impulsions (8kbit/s) a partir des positions de 2 impulsions (6,4 kbit/s) et 
reciproquement. 

On rappelle succinctement le fonctionnement du codeur UIT-T G.729. Ce 
codeur peut fonctionner a trois debits: 6,4; 8 et 11,8 kbit/s. On consktere done 
ici les deux premiers debits. Une trame de G.729 comporte 80 echantillons § 
8 kHz. Cette trame est divisee en deux sous-trames de 40 echantillons. Pour 
chaque sous-trame, le G.729 modelise le signal d'innovation par des 
impulsions selon le modele ACELP. II en utilise quatre au mode 8 kbit/s et 
deux pour le mode 6,4 kbit/s. Les tables 2 et 4 ci-avant donnent les positions 
que peuvent prendre les impulsions pour ces deux debits. A 6,4 kbit/s, une 
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recherche exhaustive de toutes les combinaisons (512) des positions est 
effective. A 8 kbit/s, une recherche focalisee est preferentiellement utilisee. 

Le traitement general au sens de Finvention est encore utilise tci. Toutefois et 
de fagon avantageuse, on tire partie ici de la structure ACELP commune aux 
deux repertoires. La mise en correspondance des jeux de positions exploite 
ainsi une decoupe de la sous-trame de 40 6chantillons en~5 pistes de 8 
positions, donnes dans la table 6 ci-apr§s. 



Pistes 


Positions 


Po 


0, 5 r 10, 15, 20, 25, 30, 35 


Pi 


1, 6, 11, 16, 21, 26, 31, 36 


P 2 


2, 7, 12, 17, 22, 27, 32, 37 


P 3 


3, 8, 13, 18, 23, 28, 33, 38 


P 4 


4, 9, 14, 19, 24, 29, 34, 39 



Table 6: Repartition des positions en cinq pistes dans les 

dictionnaires ACELP du G. 725 

Dans les deux repertoires, les positions des impulsions se partagent ces 

* 

pistes, comme le montre la table 7 ci-apr£s. 

Toutes les impulsions sont caracterisees par leur piste et leur rang dans cette 
piste. Le mode a 8 kbit/s place une impulsion sur chacune des trois premieres 
pistes et la derniere impulsion sur Tune des deux dernidres pistes. Le mode a 
6,4 kbit/s quant a iui place sa premiere impulsion sur les pistes Pi ou P3, et sa 
deuxieme impulsion sur les pistes Po, Pi, P2 ou P 4 . 
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Mode 


Impulsions 


Pistes 


6,4 kbit/s 




Pit Pa 


il 


Po, Pi, ?2, P« 


8 kbit/s 

4 


io 


Po 


il 


Pi 


i 2 


P 2 


• i 3 " 


^3/ *4 



Tajble 7: tfepartiticn des impulsions cies repertoires ACELP 
du G.729 a 8 et 6,4 kbit/s dans les cinq pistes. 

L'entrelacement des pistes (structure ISSP) est exploits dans cette realisation 
5 pour faciliter ^extraction des voisinages et la composition des sous-ensembles 
restreints de positions, Ainsi, pour se deplacer d'une piste a une autre, il suffit 
de se decaler d'une unite vers la droite ou vers la gauche. Par exemple, si Ton 
se place a la 5 i6me position de la piste 2 (de position absolue 22), un decalage 
de 1 vers la droite (+1) fait passer £ la 5 l6me position de la piste 3 (de position 
io absolue 23) et un decalage vers la gauche (-1) fait passer £ la 5 l6me position de 
la piste 1 (de position absolue 21). 

Plus gen§ralement, un decalage de ±d d'une position se traduit ici par les 

effets suivants. 
is Au niveau des pistes Pg : 

voisinage droit : P/ => P(/ + </)=5 

voisinage gauche : P t => P(i-d)=5 

Au niveau du rang m dans la piste : 

* voisinage droit : 

20 si (i+d) < 4: m i => m l 

sinon: m i => m l +1 

* voisinage gauche : 
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si (i-d) >0: m l => m i 



sinon: m i => m t -\ 



On d§crit maintenant la selection d'un sous-ensemble du repertoire ACELP & 4 
5 impulsions du codeur G.729 a 8 kbit/s a partir d'un element d'un repertoire 
ACELP § 2 impulsions du codeur G.729 & 6,4 kbit/s. 

On consid&re une sous-trame de G.729 au mode 6,4 kbit/s. Deux impulsions 
sont placees par ce codeur mais il faut determiner les positions des autres 

10 impulsions que doit placer le G.729 a 8 kbit/s. Pour restreindre radicalement la 
complexity, une seule position par impulsion est choisie et une seule 
combinaison de positions est retenue. Avantageusement, Fetape de selection 
est done immediate. On choisit deux des quatre impulsions du G.729 £ 8 kbit/s 
aux memes positions que celles du mode a 6,4 kbit/s, puis on place les deux 

15 impulsions restantes a proximite immediate des deux premieres. Comme 
indique ci-avant, la structure en pistes est exploitee. A la premiere etape de 
r€cup€ration des deux positions par d6codage de I'indice binaire (sur 9 bits) 
des 2 positions, les deux pistes correspondantes sont aussi determinees. A 
partir de ces deux pistes (eventuellement identiques), les trois dernieres 

20 etapes d'extraction des voisinages, de composition des sous-ensembles 
restreints et de selection d'une combinaison d'impulsions sont alors 
judicieusement associees. On distingue plusieurs cas selon les pistes P/ (/=0 a 
4) sur lesquelles se trouvent les deux impulsions du mode & 6,4 kbit/s. 



25 On note e k les positions des impulsions du mode a 6,4 kbit/s et Sk celle du 
mode & 8 kbit/s. La table 8 ci-apres presente pour chacun des cas les 
positions choisies. Les colonnes notees "P/fd=P" precisent la loi de voisinage 
au niveau des pistes et aboutissant a la piste P\. On rappelle qu'au niveau des 
pistes Pf, 

30 * pour le voisinage droit : P t ^> P^^^ 
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* pour le voisinage gauche : P f => P^d)^s 



eo 

(Piste) 


ei 

(Piste) 


s 0 


Si 


S2 


S3 


Position 




Position 


Pi+d-Pi 


Position 


Pi+d == P2 


Position 


fP 4 


Pi 


e 0 =ei 


Pi 


e,-l 


pH 


Ei 


Pi 


ei+1 


p, + * 


ei+2 


P,+2 




eo-1 


pH 


Eo * 


Pi 


erH 


P1+ 1 


e,+2 


Pi +2 


Pi 


Po 


ei 


Po 


Eo 


Pi 


e 0 +l 


Pi +1 


e,-l (1 > 


Pj°-I 


Pi 


P, 


eo-1 


pH 


Eo 


Pi 


ei 


P t 


e,+l 


P, +1 


Pi 


P4 


e,+l< 2) 




Eo 


Pi 


e 0 +l 


Pi +I 


ei 


P 4 


Pi 


Po 


ei 


Po 


Ei+1 


Po +} 


eo-1 


PH 


eo 


Pi 


P 3 


Pi 


e,-l 


pH 


Ei 


Pi 


e 0 -l 


PH 


eo 


Pi 


Pi 


P 2 


eo+2 (3 > 


P*+2 


E,-l 


Pr l 


ei 


Pi 


eo 


Pi 


Pi 


P4 


e,+l» 


,P*i 


Eo-2 


Ps-2 


e 0 -l 


pH 


ei 


P4 



Table 8: Choix du repertoire restreint du G.729 a 8 kit/s 



a partir des deux impulsions du repertoire ACELP du G. 729 
5 a 6,4 kbit/s. 

Preferentiellement, on cherche done a equilibrer la repartition des 4 positions 
par rapport aux deux positions de depart, mais on indique qu'un autre choix 

10 peut etre effectue. Quatre cas (signals par un exposant entre parentheses 
dans la table 8) peuvent poser toutefois des probtemes d'effets de bord: 
Cas (1) : si ei = 0, alors on ne peut pas prendre S3=ei-1. On choisira s 3 = eo+2. 
Cas (2) : si ei = 39, alors on ne peut pas prendre so=ei+1 . On choisit so= eo -1 . 
Cas (3): si ei = 38, alors on ne peut pas prendre s 0 =eo+2. On choisit so= ei -2. 

15 Cas (4): si ei = 39, alors on ne peut pas prendre So=ei+1 . On choisit so= eo -3. 
Pour diminuer encore la complexity le signe de chaque impulsion s k peut etre 
pris egal a celui de I'impulsion ej de laquelle elle est deduite. 



On decrit maintenant la selection d'un sous-ensemble du repertoire ACELP 3 2 
20 impulsions du G.729 a 6,4 kbit/s a partir d f un element d*un repertoire ACELP a 
4 impulsions du G.729 a 8 kbit/s. 
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Pour une sous-trame de G.729 au mode a 8 kbit/s, la premiere etape est la 
recuperation des positions des quatre impulsions generees par le mode 8 
kbit/s. Le decodage de I'indice binaire (sur 13 bits) des 4 positions permet 
d'obtenir leur rang dans leur piste respective pour les trois premieres positions 
(des pistes 0 a 2) et la piste (3 ou 4) de la quatrieme impulsion ainsi que son 
rang dans cette piste. Chaque position ei (OS i <4) est caracterisee par le 
couple (p it mi) ou pi est I'indice de sa piste et mi son rang dans cette piste. On 
a: 

ei =5nrii+pi, avec OS m f <8 et ppi pour i<3 et p 3 = 3 ou 4. 



Comme deja mentionne, I'extraction des voisinages et la composition des 
sous-ensembles restreints sont combinees et exploitent avantageusement la 
structure ISSP commune aux deux repertoires. En exploitant la propriete de 
positions voisines induite par Tentrelacement des pistes, on construit les cinq 
intersections Pj de I'ensemble P 8 des voisinages des 4 positions avec les 
5 pistes Pj. 

T^PsHP, 

* 

Ainsi, un voisin droit (respectivement gauche) de +1 (respectivement -1) de 
I'impulsion (p,m) appartient a Tp+i si p<4 (respectivement a r M si p>0), sinon 
(cas p=4) a T 0 a condition que m<7 (respectivement a T A (cas i=0) a condition 
que m>0). La restriction sur le voisin droit pour une position de la quatrieme 
impulsion appartenant a la quatrieme piste (respectivement gauche pour une 
position de la premiere piste) permet de s'assurer que la position voisine n'est 
pas en dehors de la sous-trame. 



Ainsi, en utilisant la notation modulo 5 (s5), un voisin droit (respectivement 
gauche) de +1 (respectivement -1) de I'impulsion (p,m) appartient a T^jse 
(respectivement a TVd= 5 ). On rappelle qu'il faut tenir compte des effets de 
bord. En generalisant a une taille d de voisinage, un voisin droit de +d 
(respectivement gauche de -d) de I'impulsion (p,m) appartient a "r<p +d)25 
(respectivement a TV^ss). Le rang du voisin a ±d est egal a m si p+ds4 (ou p- 
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d£0), sinon le rang m est increments pour un voisin droit et decrements pour 
un voisin gauche. La prise en compte des effets de bord revient done & 
s'assurer que: m<7 si p+d>4 et que m>0 si p-d <0. 

A partir de cette repartition des voisins dans les 5 pistes, ii est simple de 
5 determiner les sous-ensembles restraints S 0 et S^ des positions des deux 
impulsions : 

S6-TiUT 3 et Si= T , ouTiuT , 2ur 4 
La quatrfeme et derni&re etape consiste a effectuer la recherche du couple 
optimal dans les deux sous-ensembles obtenus. L'algorithme de recherche 
10 (comme celui normalise exploitant la structure en pistes) et le rangement par 
piste des impulsions simplifient Id encore Palgorithme de recherche. En 
pratique, il est done inutile de constituer explicitement les sous-ensembles 
restraints S 0 et Si car les ensembles T j peuvent etre utilises seuls. 

15 Dans Pexemple ci-apr&s, le mode a 8 kbit/s du G.729 a plac6 ses quatre 
impulsions aux positions suivantes : 

e 0 = 5 ; ei= 21 ; e2= 22 ; e 3 = 34 ; 
Ces 4 positions sont caracterisSes par les 4 couples (pi,mj)= (0,1), (1, 4), (2,4) 
(4,6). 

20 Si Ton prend un voisinage fixe §gal a 1 , on construit les 5 intersections Tj 
comme suit : 

e 0 : (0, 1) donne : (4,0) a gauche et (1, 1) a droite 
ei : (1 ,4) donne : (0,4) a gauche et (2,4) £ droite 
e2 : (2,4) donne : (1 ,4) a gauche et (3,4) a droite 
25 e 3 :(4,6) donne : (3, 6) a gauche et (0,7) a droite 

On a done : 



T Q ={(0 9 1),(0A),(QJ)y t ri={(1,4),(1,1))}; r 2 ={(2,4)}; T' 3 ={(3,4),(3,6)}; 

T-4 = {(4,6),(4,0)} 
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En revenant d la notation par positions : 

To={5,20,35}; Ti={21, 6}; T 2 ={22}; T' 3 ={23,33}; 

T 4 = {34,4} 



5 A la dernfere etape, un algorithme semblable a celui du G.729 a 6,4 kbit/s 
effectue la recherche du meilleur couple d'impulsions. Cet algorithme est ici 
bien moins complexe car le nombre de combinaisons de positions & explorer 
est tres restreint. Dans Pexemple, il n'y a que 4 (= Cardinal(Ti) + Cardinal(T' 3 )) 
fois 8 (= Cardinal(T 0 ) + Cardinal^) + Cardinal(r 2 ) + Cardinal(T' 4 )) 

10 combinaisons d tester, soit 32 combinaisons au lieu de 512. 

Pour un voisinage de taille 1 , moins de 8% des combinaisons des positions est 
a explorer en moyenne sans depasser 10% (50 combinaisons). Pour un 
voisinage de taille 2, moins de 17% des combinaisons des positions est a 

15 explorer en moyenne et au plus 25% des combinaisons est a explorer. Pour 
un voisinage de taille 2, la complexity du traitement propose dans I'invention 
(en cumulant le coQt de la recherche dans le repertoire restreint au coOt de 
Pextraction des voisinages assocte a la composition des intersections) 
represente moins de 30% d'une recherche exhaustive pour une quality 

20 §quivalente. 

* Exemple de realisation n°3 

Le dernier exemple illustre les passages entre le modele ACELP du G.729 d 8 
kbit/s et le modele MP-MLQ du G.723.1 a 6,3 kbit/s. 

25 

Un transcodage intelligent des impulsions entre le G.723.1 (mode 6,3 kbit/s) et 
le G.729 (mode 8 kbit/s) comporte deux difficultes importantes. En premier 
lieu, la taille des trames est differente (40 echantillons pour le G.729 contre 60 
echantillons pour le G.723.1). La seconde difficulte est liee a la structure 
30 differente des dictionnaires, du type ACELP pour le G.729 et du type MP-MLQ 
pour le G.723.1. Uexemple de realisation presente ici montre comment 
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I'invention leve ces deux difficultes afln de transcoder a moindre coQt les 
impulsions tout en preservant la qualite du transcodage. 

On effectue d'abord une correspondance temporelle entre les positions dans 
5 les deux formats en prenant en compte la difference de taille des sous-trames 
pour aligner les positions relativement a une origine commune a E et S. Les 
longueurs des sous-trames du G:729 et du G.723.1 ayant cornme plus petit 
commun multiple 120, la correspondance temporelle est effectuee par blocs 
de 120 echantillons soit deux sous-trames de G.723.1 pour trois sous-trames 
10 de G.729, comme le montre I'exemple de la figure 4b. En variante, on peut 
preferer travailler sur des blocs de trames completes. Dans ce cas, on choisit 
des blocs de 240 echantillons soit une trame de G.723.1 (4 sous-trames) pour 
trois trames de G.729 (6 sous-trames). 

is On decrit maintenant la selection d'un sous-ensemble du repertoire MP-MLQ 
du G.723.1 a 6,3 kbit/s a partir d'elements du repertoire ACELP a 4 impulsions 
du G.729 a 8 kbit/s. La premiere etape consiste a recuperer les positions des 
impulsions par blocs de 3 sous-trames (d'index 4, 024^2) du G.729. On note 
Pe('e) une position de la sous-trame i e de ce bloc. 

20 

Avant d'extraire les voisinages, on convertit ces 12 positions p e (4) en 12 
positions notees p s (j s ), reparties dans deux sous-trames (d'index j s , OrS/s^l) de 
G.723.1. On peut utiliser la relation generate ci-avant (faisant intervenir le 
modulo de la longueur de sous-trame) pour realiser Padaptation des durees de 
25 sous-trames. On prefere toutefois ici distinguer simplement trois cas selon 
I'indice i e : 

si 4 =0, alors y s =0 et p s = p e 
si 4 =2, alors j s =1 et p s = p e +20 

si 4 =1, alors si p e <20j s =0 et p s - p e +40, sinon (Pe^20) : j s -1 et 
30 p s = Pe-20 

On n'effectue ainsi ni division ni operation modulo n. 
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Les 4 positions recuperees dans la sous-trame STEO du bloc sont directement 
attributes a la sous-trame STSO avec la mtme position, celles de la sous- 
trame STE2 du bloc sont directement attributes a la sous-trame STS1 avec un 
increment de +20 de position, les positions de la sous-trame STE1 inferieurs a 
5 20 sont attributes a la sous-trame STSO avec un increment de +40, les autres 
etant attributes a la sous-trame STS1 avec un dtcrtment de -20. 

On extrait ensuite les voisinages de ces 12 positions. II faut noter que Ton peut 
autoriser les voisinages droits (respectivement gauches) des positions de la 
10 sous-trame STSO (respectivement STS1) a sortir de leur sous-trame, ces 
positions voisines etant alors dans la sous-trame STS1 (respectivement 
STSO). 

L'etape de correspondence temporelle et d'extraction de voisinage peuvent 
15 etre inversees. Dans ce cas, on peut autoriser les voisinages droits 
(respectivement gauches) des positions de la sous-trame STEO 
(respectivement STE2) a sortir de leur sous-trame, ces positions voisines ttant 
alors dans la sous-trame STE1. De mtme, les voisinages droits 
(respectivement gauches) des positions dans STE1 , peuvent conduire a des 
20 positions voisines dans STE2 (respectivement STEO). 

Une fois I'ensemble des positions restreintes pour chaque sous-trame STS 
constitut, la derniere etape consiste a explorer pour chaque sous-trame STS 
son repertoire restreint ainsi constitut pour stlectionner les N p (6 ou 5) 
25 -impulsions de mtme paritt. Cette procedure peut ttre dtrivte de I'algorithme 
normalist ou s'inspirer d'autres procedures de focalisation. 

Pour illustrer cet exemple de realisation, on considere trois sous-trames du 
G.729 qui vont permettre de construire les sous-rtpertoires de deux sous- 
30 trames du G.723.1 . En supposant que le G.729 donne les positions suivantes : 

STEO:e 0 o=5; e 0 i= 1; e 02 = 32 ; e 03 =39; 
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STE1 : eio- 15 ; e«= 31; e* 2 = 22 ; e*3- 4; 

STE2:e 2 o-0; e 21 = 1; e 22 =37; 6*3=24, 
apres application de I'etape ci-avant de correspondance temporelle, 
('attribution de ces 12 positions aux sous-trames STSO et STS1 est : 
STSO :sqo-5; s 01 = 1; s 02 =32; s w = 39;(s 0k -e 0k ) 
STSO : s'io= 55 ; s'«= 44; (s' 0k =e 1k +40, si e 1k <20) 
STSL s'n- 11; s' 12 ~ 2 (s' 1k =e 1k -20; si e 1k >20) 
STS1:s 2< j=20; s 2i =21; s 22 = 57 ; s 23 = 44 ; (so^e^+20) 

On a done les jeux de positions {1, 5, 32, 39, 44, 55} pour la sous-trame STSO 
et {2,11, 20, 21 , 44, 57} pour la sous-trame STS1 . 

II faut a present en extraire les voisinages. En prenant par exemple un 
voisinage fixe a 1 , on obtient : 

PsO B {°'^)U( 4 » 5 ' 6 U{ 31 - 32 ^ 3 U{ 38 ' 39 ' 40 U{ 43 .^ 45 )U{ 54 . 5 5.56} 
Psl " toHJ f 10 ' 1 U2)L) {20,21,22)1J {21^2,23)(J {43,44,45]|J {56^7,58} 

Le MP-MLQ n'impose aucune contrainte aux impulsions, mis a part leur parite. 

Sur une sous-trame, elles doivent etre toutes de la meme parite. II faut done ici 

scinder P s o et P s i en deux sous ensembles, avec : 

- Pso : {0,2,4,6,32,40,44,54,56} et {1,5,31 ,33,39,43,45,55} 

-P s1 : {2,10,12,20,22,44,56} et {1,3,11,21,23,43,45,57} 

Ce sous-repertoire est enfin transmis a Palgorithme de selection qui determine 
les N p meilleures positions au sens du critere CELP pour les sous-trames 
STSO et STS1 du G.723.1. On restreint ainsi considerablement le nombre de 
combinaisons testees. En effet, par exemple dans la sous-trame STSO, il reste 
9 positions paires et 8 positions impaires au lieu de 30 et 30. 

On s'assure toutefois de certaines precautions dans les cas oil les positions 
choisies par le G.729 sont telles que I'extraction des voisinages donne un 
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nombre N de positions possibles inferieur au nombre de positions du G.723.1 
(N<N P ). C'est le cas notamment lorsque les positions du G.729 se suivent 
toutes (ex : {0,1 ,2,3}). On prevoit alors deux possibility : 

- augmenter la taille du voisinage pour les sous-trames concernees 
5 jusqu'a obtenir une taille suffisante pour P s (taille>A/ p ), 

- ou selectionner les N premieres impulsions et autoriser pour les N p -N 
impulsions restantes une recherche parmi les 30-N positions restantes 
de la grille, comme decrit ci-avant. 

10 On decrit maintenant le traitement inverse consistant a selectionner un sous- 
ensemble du repertoire ACELP a 4 impulsions du G.729 a 8 kb'rt/s a partir 
d'elements d'un repertoire MP-MLQ du G.723.1 a 6,3 kbit/s. 

Globalement, le traitement est similaire. Deux sous-trames de G.723.1 
15 correspondent a 3 trames de G.729. Ici aussi, on extrait les positions du 
G.723.1 que Ton traduit dans Pechelle de temps du G.729. On pourra 
avantageusement traduire ces positions sous la forme "piste - rang dans la 
piste" afin de profiter comme prec§demment de la structure ACELP pour 
extraire les voisinages et rechercher les positions optimales. 

20 

Les m£mes amenagements que precedemment sont pr§vus pour prevenir les 
cas ou I'extraction des voisinages donnerait des positions en nombre 
insuffisant (ici moins de 4 positions). 

25 Ainsi, la presente invention permet de determiner a moindre coQt les positions 
d'un jeu d'impulsions a partir d'un premier jeu d'impulsions, les deux jeux 
d'impulsions appartenant a deux repertoires multi-impulsionnels. Ces deux 
repertoires peuvent se distinguer par leur taille, la longueur et le nombre 
d'impulsions de leurs mots de codes ainsi que par les regies regissant les 

30 positions et/ou amplitudes des impulsions. On privilegie les voisinages des 
positions des impulsions du (ou des) jeu(x) choisi(s) dans le premier repertoire 
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pour determiner celles d'un jeu dans le deuxfeme repertoire. L'invention 
permet en plus d'exploiter la structure des repertoires de depart et/ou d'arrivee 
pour r6duire davantage la complexity. A travers le premier exemple ci-avant 
pr6sentant le passage d'un module MP-MLQ £ un module ACELP, on 

5 comprendra que Pinvention s'applique ais6ment a deux modules rnulti- 
impulsionnels ayant des contraintes structurelles diff6rentes. A travers le 
second exemple~de realisation pr£sentant le passage entre deux modules— 
poss6dant un nombre d'impulsions different mais bas6s sur la meme structure 
ACELP, on comprendra que invention permet avantageusement Pexploitation 

10 de la structure des repertoires pour reduire la complexity de transcodage. A 
travers le troisieme exemple pr6sentant le passage entre un module MP-MLQ 
et un modele ACELP, on comprendra que Pinvention peut s'appliquer m§me 
pour des codeurs de longueurs de sous-trames ou de frequences 
d'echantillonnage differentes. ^invention permet d'ajuster le compromis 

15 qualite/complexite et, en particulier, de r6duire fortement la complexite de 
calcul pour une degradation minime par rapport a une recherche classique 
d'un modele multi-impulsionnel. 
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Revendications 

1. Proced6 de transcodage entre un premier codeur/d6codeur en compression 
et au moins un second codeur/d6codeur en compression, lesdits premier et 

5 second codeurs/decodeurs etant de type impulsionnel et utilisant des 
dictionnaires multi-impulsionnels dans lesquels chaque impulsion comporte 
une positionr reper&e par un indice assocte, 

caracteris6 en ce qu'il comporte ies etapes suivantes : 

a) le cas 6cheant, adaptation de parametres de codage entre lesdits premier 
10 et second codeurs/decodeurs, 

b) obtention, d partir du premier codeur/d<§codeur, d'un nombre choisi (N e ) de 
positions d'impulsions et d'indices de positions (eO respectivement assoctes, 

c) pour chaque position d'impulsion courante d'indice donne, formation d'un 
groupe de positions d'impulsions comportant au moins la position d'impulsion 

is courante et des positions d'impulsions d'indices associes immediatement 
inferieurs et immediatement sup6rieurs a I'indice donn6, 

d) selection, en fonction de positions d'impulsions (Tj) admises par le second 
codeur/decodeur, d'une partie au moins des positions d'impulsions dans un 
ensemble (P s ) constitue par une union desdits groupes formes a I'etape c), et 

20 e) transmission des positions d'impulsions ainsi selectionnees au second 
codeur/decodeur, pour un codage/decodage a partir desdites positions 
transmises, 

ladite selection de I'etape d) faisant alors intervenir un nombre de positions 
d'impulsions possibles inferieur au nombre total de positions d'impulsions 
25 possibles du dictionnaire du second codeur/decodeur. 

2. Procede selon la revendication 1, dans lequel le premier codeur/decodeur 
(E) utilise, dans un premier format de codage, un premier nombre 
d'impulsions, 

30 caracteris§ en ce que ledit nombre (N e ) choisi a I'etape b) correspond a ce 
premier nombre de positions d'impulsions. 
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3. Procedg selon la revendication 2, dans lequel : 

- le premier codeur/decodeur (E) utilise, dans un premier format de codage, un 
premier nombre (N e ) de positions d'impulsions, 

5 - le second codeur/decodeur (S) utilise, dans un second format de codage, un 
second nombre (N s ) de positions d'impulsions, 

caract6ris6 en ce qu'il comporte en* outre- une §tape consistant & discriminer au 
moins les cas oCi : 

- le premier nombre (N e ) est sup6rieur ou 6gal au second nombre (N s ), 
10 - le premier nombre (N e ) est inferieur au second nombre (N s ). 

4. Precede selon la revendication 3, dans lequel le premier nombre (N e ) est 
supgrieurou 6gal au second nombre (N s ) (N e ^N s ), 

caract6ris6 en ce que chaque groupe forme d l'6tape c) comporte des 
15 positions d f impulsions voisines de droite (va) et des positions d'impulsions 
voisines de gauche (Vg) de ladite position d'impulsion courante d'indice donn§, 
et en ce que les nombres respectifs de positions d'impulsions voisines de 
gauche et de droite sont choisis en fonction d'un compromis en complexit6 et 
en qualite de transcodage. 

20 

5. Procede selon la revendication 4, caract6ris§ en ce qu'a I'etape d), on 
construit un sous-r6pertoire de combinaisons de positions d'impulsions 
resultant des intersections (Sj) de : 

- Tensemble (P s ) constitue par une union desdits groupes form6s & I'etape c), 
25 et 

- des positions d'impulsions (Tj) admises par le second codeur/decodeur, 

de sorte que ledit sous-repertoire soit de taille inferieure au nombre de 
combinaisons de positions d'impulsions (Tj) admises par le second 
codeur/decodeur. 

30 
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6. Proc6d6 selon la revendication 5, caracterise en ce que, aprds I'etape e), on 
recherche dans ledit sous-r6pertoire un jeu de positions optimal comportant 
ledit second nombre (N s ) de positions, au niveau du second codeur (S). 

5 7. Proc6de selon la revendication 6, caracterise en ce que l'6tape de 
recherche du jeu de positions optimal est mise en oeuvre par une recherche 
-focalisee pour acc6l§rer I'exploration dudit sous-r6pertoire. 

8. Proc6d6 selon Tune des revendications pr6c6dentes, dans iequel ledit 
10 premier codeur/decodeur est agenc6 pour delivrer une succession de trames 
cod6es, caract6ris6 en ce que les nombres respectifs de positions 
d'impulsions dans les groupes form6s d I'etape c) sont successivement choisis 
d'une trame a I'autre. 

15 9. Proc<§d§ selon la revendication 3, dans Iequel le premier nombre (N e ) est 
inf6rieur au second nombre (N s ) (N e <N s ), 

caract6ris6 en ce que Ton teste en outre si les positions d'impulsions prevues 
dans le second nombre de positions d'impulsions (N s ) se retrouvent parmi des 
positions d'impulsions des groupes formes & T6tape c), 
20 et, en cas de r6ponse negative ^ ce test, on augmente le nombre de positions 
^impulsions dans les groupes formes a l'6tape c): 

10. Procede selon la revendication 3, caracterise en ce que Ton discrimine en 
outre le cas oCi le second nombre N s est compris entre une et deux fois le 
25 -premier nombre N e (N e <Ns<2Ne), 
et, dans ce cas : 

d) on selectionne d'emblee les N e positions d'impulsions, 
c2) et on selectionne en outre un nombre complementaire de positions 
d'impulsions N s -N e , definies dans le voisinage immediat des positions 
30 compulsions selectionnees a I'etape c1). 
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1 1 . Procede selon Tune des revendications prec§dentes, dans lequel ledit 
premier codeur/decodeur est agence pour op6rer avec une premiere 
frequence d'echantillonnage donn6e et a partir d'une premiere dur6e donn6e 
de sous-trame, 

5 caracterise en ce que lesdits parametres de codage pour lesquels est 

* 

ladite adaptation de I'etape a) comportent au moins une dur6e de sous-trame 
et une frequence d'echantillonnage, tandis que le second codeur/decodeur 
opere avec une seconde frequence d'echantillonnage et une seconde dur6e 
de sous-trame, 

io et en ce que, d l'6tape a), on discrimine les quatre cas suivants : 

- les premiere et seconde durees sont egales et les premiere et seconde 
frequences sont egales, 

- les premiere et seconde dur6es sont egales et les premiere et seconde 
frequences sont differentes, 

is - les premiere et seconde dur6es sont differentes et les premiere et 

seconde frequences sont egales, 

- les premiere et seconde durees sont differentes et les premiere et 
seconde frequences sont differentes. 

20 12. Precede selon la revendication 11, dans lequel les premiere et seconde 
durees sont egales et les premiere et seconde frequences d'echantillonnage 
sont differentes, 

caracterise en ce qu'il comporte des etapes : 
a1) de quantification directe d'echelle temporelle de la premiere frequence 

25 vers la seconde frequence, 

a2) et de determination, en fonction de ladite quantification, de chaque position 
d'impulsion dans une sous-trame au second format de codage caracterise par 
la seconde frequence d'echantillonnage, a partir d'une position d'impulsion 
dans une sous-trame au premier format de codage caracterise par la premiere 

30 frequence d'echantillonnage. 
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13. Procecte selon la revendication 12, caracterise en ce que retape a1) de 
quantification s'effectue par calcul et/ou tabulation a partir d'une fonction qui, & 
une position d'impulsion dans une sous-trame au premier format (p e ), fait 
correspondre une position d'impulsion dans une sous-trame au second format 
5 (p s ), ladite fonction se presentant sensiblement comme une combinaison 
lineaire faisant intervener un coefficient multiplicatif correspondant au rapport 
de la seconde frequence d'^chantillonnage sur la premiere - frequence 
d'echantillonnage. 

10 14. Proc6d6 selon la revendication 13, caracterise en ce que, pour passer 
inversement d'une position d'impulsion dans une sous-trame au second format 
(p s ) a une position d'impulsion dans une sous-trame au premier format (p©), on 
applique une fonction inverse de la ladite combinaison lineaire appliquee d une 
position d'impulsion dans une sous-trame au second format (p s ). 

15 

15. Procede selon la revendication 11, dans lequel les premiere et seconde 
durees sont 6gales et les premiere et seconde frequences d'echantillonnage 
sont differentes, 

caracterise en ce qu'il comporte les etapes suivantes : 
20 a'1) sur-echantillonner une sous-trame au premier format de codage 
caract6ris6 par la premiere frequence d'Schantillonnage, a une frequence 
egale au plus petit commun multiple des premiere et seconde frequences 
d'echantiflonnage, et 

a'2) appliquer § la sous-trame sur-6chantillonn§e un filtrage passe-bas, suivi 
25 d'un sous-echantillonnage, pour atteindre une frequence d'echantillonnage 
correspondant a la seconde frequence d'echantillonnage. 

16. Procede selon la revendication 15, caracterise en ce que le procede se 
poursuit par I'obtention, par seuillage, d'un nombre de positions, le cas 

30 echeant, variable. 



WO 2005/066936 



PCT/FR2004/003008 



58 

17. Precede selon la revendication 12, caract§ris6 en ce qu'il comporte en 
outre une etape de mise en correspondence, pour chaque position (p e ) d'une 
impulsion d'une sous-trame au premier format de codage caract6ris6 par la 
premiere frequence d'echantillonnage, d'un groupe de positions d'impulsions 
5 (p s ) dans une sous-trame au second format de codage caracterise par la 
seconde frequence d'6chantillonnage, chaque groupe comportant un nombre 
de" positions nqui est fonctian dir rapport entre la seconde" et la premiere r 
frequence d'6chantillonnage (Fs/F e ). 

10 18. Proc€d§ selon la revendication 11, dans lequel les premiere et seconde 
dur€es de sous-trames sont diff&rentes, 

caracteris6 en ce qu'il comporte les stapes : 
a20) de definition d'une origine commune (O) aux sous-trames des premier et 
second formats, 

15 a21)de d§coupage des sous-trames successives du premier format de 
codage caracteris6 par une premiere dur€e de sous-trame, pour former des 
pseudo-sous-trames de durees correspondantes & la dur6e de sous-trame du 
second format, 

a22) de mise a jour de ladite origine commune, 
20 a23) et d'une determination de correspondance entre les positions 
d'impulsions dans les pseudo-sous-trames et dans les sous-trames au second 
format. 

19. Precede selon la revendication 18, characterise en ce que i'on discrimine en 
25 outre les cas suivants : 

- les premiere et seconde durees sont fixes dans le temps, et 

- les premiere et seconde durees varient dans le temps. 

20. Precede selon la revendication 19, dans lequel les premiere et seconde 
30 durees sont fixes dans le temps, 
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caractgrise en ce que la position temporelle de ladite origine 
commune est remise periodiquement a jour a chaque instant 0C1 des frontferes 
de sous-trames respectives de premfere et de seconde duree sont align§es 
dans !e temps. 

5 

21. Proced6 selon la revendication 19, dans lequel les premiere et seconde 
d ur^es varient dans le temps, 

caract6ris6 en ce que : 
a221) on effectue successivement deux sommations respectives des durSes 
10 des sous-trames au premier format et des durees des sous-trames au second 
format, 

a222) on detecte une occurrence d'une egalite entre lesdites deux sommes, 
d§finissant un instant de remise d jour de ladite origine commune, 
a223) on reinitialise lesdites deux sommes, apres ladite occurrence, pour une 
is future detection d'une prochaine origine commune. 

22. Produit programme d'ordinateur destin§ a §tre stock6 dans une memoire 
d'une unite de traitement, notamment d'un ordinateur ou d'un terminal mobile, 
ou sur un support memoire amovible et desting a cooperer avec un lecteur de 

20 I'unite de traitement, 

caracteris6 en ce qu'il comporte des instructions pour la mise en oeuvre du 
precede de transcodage selon Tune des revendications pr§c6dentes. 

23. Dispositif de transcodage entre un premier codeur/decodeur en 
25 compression et au moins un second codeur/dScodeur en compression, lesdits 

premier et second codeurs/decodeurs etant de type impulsionnel et utilisant 
des dictionnaires multi-impulsionnels dans lesquels chaque impulsion 
comporte une position reperee par un indice associe, 

caracterise en ce qu'il comporte une memoire propre a stocker des instructions 
30 d'un produit programme d'ordinateur selon la revendication 22. 
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